为 什么 要 写 这 本 书 


我 对 图 像 处 理 的 认识 最 初 来 自 于 读 软 件 工程 专业 时 做 毕业 设计 论文 的 需要 ， 毕 业 论 文 做 完 以 后 ， 我 便 把 所 有 关于 图 像 处 理 的 知识 扔 到 了 一 边 。2011 年 的 一 天 有 位 朋友 问 了 我 几 个 简单 的 图 像 处 理 方面 的 
问题 ， 在 解答 问题 的 过 程 中 我 发 现 自己 对 图 像 处 理 的 热情 一 直 都 在 燃烧 ， 从 那 一 刻 起 我 决定 重新 学 习 图 像 处 理 。 这 之 后 ， 我 把 以 前 买 的 几 本 图 像 处 理 的 书 都 读 了 一 遍 ， 同 时 还 坚持 通过 写 博 客 来 督促 自己 加 
深 理 解 ， 随 着 学 习 的 不 断 深 入 ， 对 图 像 处 理 的 认 知 也 在 不 断 加深 ， 我 越 来 越 渴 望 自己 能 实现 那些 书 中 提 到 的 图 像 处 理 手段 与 方法 ， 于 是 便 开 始 不 断 党 试 ， 在 经 过 了 各 种 “ 坑 ” 与 无 助 之 后 ， 我 终于 编程 实现 
了 学 习 过 的 每 一 种 图 像 处理 方 法 。 这 个 过 程 十 分 痛苦 ， 因 为 我 深刻 感受 到 了 图 像 处 理 在 理论 与 实践 之 间 的 细微 差异 ， 而 这 些 细微 差异 往往 会 导致 处 理 结果 与 理论 预期 相差 很 大 。 


可 能 提 到 图 像 处 理 ， 很 多 人 马上 就 会 想到 相关 书籍 中 各 种 复杂 的 数学 公式 与 矩阵 计算 ， 然 后 就 会 说 我 数学 不 好 学 不 了 这 个 ， 早 早 地 就 把 自己 给 否定 了 。 那 些 数学 公式 的 确 让 人 望 而 生 畦 ， 但 是 只 要 仔细 
探究 一 番 ， 就 会 发 现 它 在 图 像 处 理 的 应 用 上 远 远 没有 看 上 去 那么 复杂 ， 甚 至 可 以 说 十 分 简单 ， 这 是 本 人 学 习 图 像 处 理 时 得 到 的 最 大 一 个 心得 体会 ， 正 如 一 句 俗语 说 的 : “世上 无 难事 ， 只 怕 有 心 人 ”。 


正 是 因为 自己 在 学 习 过 程 中 经 历 了 痛苦 ， 所 以 我 想 写 一 本 不 一 样 的 图 像 处 理 入 门 图 书 ， 内 容 不 再 是 冰冷 的 数学 公式 与 文字 描述 ， 而 是 基于 理论 的 实践 步骤 和 细节 详解 ， 是 一 个 个 可 以 直接 运行 的 代码 实 
现 ， 书 中 没有 大 量 的 数学 公式 ， 有 的 只 是 数学 知识 的 巧妙 运用 。 我 希望 通过 分 享 自己 学 习 过 程 中 的 体会 与 编程 实践 经 验 ， 帮 助 更 多 人 在 学 习 图 像 处 理 的 道路 上 少 走 弯路 ， 早 日 进入 图 像 处理 的 科学 殿堂 。 


在 国内 ， 程 序 员 写 书 早已 经 不 是 什么 新 鲜 事 物 ， 但 是 我 可 以 肯定 地 说 ， 本 书 是 国内 第 一 本 由 奋斗 在 编码 一 线 的 码 农 写 的 图 像 处 理 入 门 图 书 。 它 不 是 当下 流行 的 视觉 图 像 处理 库 的 应 用 介绍 ， 而 是 图 像 处 
理 基 础 知识 和 理论 的 学 习 与 实践 ， 正 如 一 句 西方 科技 谚语 所 说 的 那样 ，“ 人 在 理论 上 ， 理 论 与 实践 是 一 致 的 ， 在 实践 上 ， 它 们 是 不 一 致 的 ”。 当 前 关于 图 像 处 理 的 书 大 多 数 都 是 重 理论 而 轻 实 践 ， 但 图 像 处 理 
在 理论 与 实践 编程 之 间 是 存在 轻微 差异 的 ， 而 这 就 成 了 很 多 初学 者 无 法 逾越 的 鸿沟 。 本 书 就 是 要 拟 合理 论 与 实践 之 间 的 鸿沟 ， 帮 助 读者 架 起 从 理论 到 实践 的 大 桥 。 


作为 工作 超过 十 年 的 程序 员 写 的 第 一 本 书 ， 本 书 也 是 我 个 人 职业 生涯 的 一 个 新 起 点 ， 它 鞭策 与 勉励 自己 不 断 努 力 上 进 ， 除 了 对 图 像 处 理 的 兴趣 外 ， 这 一 年 多 写 书 的 动力 更 多 的 是 部 力 与 帮助 后 来 者 的 初 
衷 。 只 要 本 书 能 为 国内 图 像 处 理 专业 知 识 的 普及 与 应 用 实践 略 尽 绵薄 之 力 ， 那 辛苦 也 就 值 了 。 
读者 对 象 

本 书 适合 以 下 人 和 群 阅读 : 

. 从 事 图 像 处 理 的 工作 人 员 

. 学 习 图 像 处 理 的 爱好 者 

` 希望 提升 自我 的 中 高 级 程序 员 

计算 机 专业 高 年 级 本 科 生 或 研究 生 

.开设 图 像 处 理 相关 课程 的 大 专 院 校 学 生 


.从事 Java 应 用 的 开发 者 


如 何 阅读 本 书 


本 书 分 为 两 大 部 分 ， 其 中 第 一 部 为 前 三 章 ， 主 要 介绍 Java Swing 编 程 的 基础 知识 。 第 二 部 分 是 本 书 的 核心 内 容 ， 系 统 全 面 地 介绍 图 像 处 理 的 各 种 方法 与 常见 应 用 场景 编程 实现 。 如 果 你 已 经 对 Java 语 言 
和 Java Swing 有 基本 的 认识 ， 可 以 跳 过 前 三 章 ， 直 接 从 第 4 章 开始 阅读 本 书 。 同 时 本 书 注重 实践 ， 所 以 请 务必 阅读 给 出 的 源 代码 并 运行 已， 这 样 才能 更 好 地 理解 所 讲 的 知识 。 


第 一 部 分 为 基础 篇 ， 简 单 地 介绍 了 Java Swing 图 形 与 图 像 编 程 基本 APl 使 用 技巧 ， 以 及 相关 实践 编程 ， 帮 助 读者 了 解 图 像 接 口 在 java 语言 中 的 基础 知识 ， 并 熟悉 像素 的 读 写 与 操作 。 


第 二 部 分 为 实践 与 应 用 编程 ， 从 最 基础 的 像素 操作 开始 ， 通 过 实践 编程 讲解 图 像 处 理 过 程 中 各 种 基本 像素 运算 、 混 合 、 图 像 插值 、 直 方 图 获取 与 图 像 搜索 、 图 像 卷 积 、 边 缘 提取 、 二 值 图 像 分 析 与 特征 
提取 等 知识 ， 最 后 通过 剖析 一 个 流行 的 图 像 油画 转换 算法 编程 实践 来 结束 本 书 。 


附录 为 本 书 相关 数学 知识 简单 参考 。 其 他 参考 资料 索引 可 在 我 的 Github 上 找到 。 


此 外 ， 本 书 的 源 文件 可 到 www.hzbook.com 上 通过 搜索 本 书 下 载 ， 或 者 到 github 上 下 载 。 


勘误 和 支持 


由 于 作者 的 水 平 有 限 ， 编 写 的 时 间 也 很 仓促 ， 书 中 难免 会 出 现 一 些 错误 或 不 准确 的 地 方 ， 已 请 读者 批评 指正 。 本 书 配套 源 代码 已 上 传 到 github 上 ， 访问 地 址 
为 : https://github.com/gloomyfish/mybook-java-imageprocess， 如 果 有 读者 想 直 接 提交 勘误 之 后 的 代码 ， 请 先 邮件 联系 本 人 ， 同 意 以 后 即 可 提交 ， 同 时 本 人 也 会 根据 读者 反馈 修改 更 新 源 代码 。 如 果 
你 有 更 多 的 宝贵 意见 ， 也 欢迎 发 送 邮 件 至 我 的 邮箱 bfnh1998@hotmail.com， 我 很 期 待 能 够 听 到 你 们 的 真 执 反 馈 。 
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第 1 章 Java Graphics 及 其 API 简 介 


在 开始 本 书 内 容 之 前 ， 笔 者 假设 你 已 经 有 了 面向 对 象 语言 编程 的 基本 概念 ， 了 解 Java 语 言 的 基本 语法 与 特征 ， 原 因 在 于 本 书 的 所 有 源 代码 都 是 基于 Java 语 言 实现 的 ， 而 且 是 基于 Java 开 发 环境 运行 与 演 
示 所 有 图 像 处 理 算法 的 。 本 书 第 1 章 到 第 3 章 是 为 了 帮助 读者 了 解 与 掌握 Java 图 形 与 GUI 编程 的 基本 知识 与 概念 而 写 的 。 本 章 主 要 介绍 Java GUI 编程 中 基本 的 图 形 知识 ， 针 对 GUI 编程 ，Java 语 言 提供 了 两 套 
几乎 并 行 的 AP1， 分 别 是 Swing 与 AWT。 早 期 的 Java GUI 编程 中 主要 使 用 AWT 的 相关 组 件 ， 但 是 AWT 的 功能 并 不 是 十 分 强大 ， 而 且 严 重 依赖 本 地 接口 。 于 是 在 Java 1.3 及 后 续 版 本 中 引入 了 Swing 工具 实现 
GUI 编程 ，Swing 中 的 组 件 大 多 数 都 是 基于 纯 Java 语 言 实现 的 ， 而 不 是 通过 本 地 组 件 实现 的 ， 所 以 它们 是 轻 量 级 的 GUI 组 件 ， 同 时 Swing 对 图 形 与 图 像 的 支持 操作 也 有 很 大 的 提高 与 增强 。 如 何 区 分 AWT 组 件 
与 Swing 组 件 ? 一 个 简单 而 且 相 当 直 观 的 方法 是 看 Class 的 名 称 ，Swing 的 组 件 大 多 数 带 有 大 写 的 前 绎 字母 J。 


Graphics 作 为 Java 的 图 形 引擎 绘制 接口 ， 几 何 形状 、 文 字 、 图 像 的 绘制 都 必须 通过 它 完 成 ， 此 外 ，Graphics 还 支持 绘制 过 程 的 控制 ， 可 以 设置 画笔 颜色 、 纹 理 、 颜 色 填 充 方法 、 合 成 与 裁剪 路 径 及 各 种 
stroke 与 Fill 的 属性 等 。 用 户 程序 通常 都 是 通过 Graphics 来 访问 绘制 引擎 ， 从 而 实现 各 种 图 形 与 图 像 绘 制 的 ， 因 此 可 以 说 Graphics 是 Swing 中 最 重要 的 接口 对 象 。 好 吧 ， 下 面 让 我 们 一 起 揭 开 Graphics 的 神秘 
面纱 。 


1.1 什么 是 Java 图 形 设备 Graphics 


简单 地 说 Graphics 是 Java 图 形 绘制 引擎 的 访问 接口 ， 只 有 通过 它 才 可 以 访问 到 Java GUI 的 图 形 绘制 引擎 ， 实 现 图 形 的 绘制 与 绘制 过 程 的 控制 |。 


1.2 Java 2D API 


当 Graphics 向 下 转型 为 Grahpics2D 时 ，Java 2D 的 图 形 绘制 引擎 得 以 访问 ， 一 个 功能 更 加 丰富 的 图 形 库 呈 现在 读者 眼前 ， 它 就 是 Java 2D API。 如 果 你 问 笔者 Java 2D 与 Swing 有 何 关 系 ， 可 以 很 认真 地 
说 ， 二 者 毫 无 瓜葛 ，Java 通 过 引入 Swing、Java 2D 与 Java 3D， 极 大 地 丰富 了 Java 的 图 形 功 能 ， 使 应 用 程序 接口 更 加 完善 ， 为 各 种 可 能 的 图 形 开发 提供 了 可 靠 保 证 与 全 面 支 持 ， 从 而 也 使 得 学 习 Java 图 形 方 
面 的 知识 时 不 再 那么 无 助 了 。 下 面 来 看 一 下 Java 2D 对 图 形 支 持 与 改进 都 包括 了 哪些 : 


* 为 显示 设备 与 打印 机 提供 统一 的 绘制 引擎。 
一 个 广泛 的 几何 形状 支持 。 

` 文档 打印 支持 。 

“ 可 控制 的 绘制 质量 。 

“ 增强 的 色彩 支持 。 


文字、 和 形状、 图像 绘制 检测 。 


1.3 用 Java Swing 绘制 自 定义 的 JPanel 
Swing 的 JPanel 组 件 是 GUI 编程 中 最 重要 的 面板 组 件 ， 可 以 通过 重 写 JPanel 中 paint-Component 方 法 实现 对 JPanel 面 板 组 件 的 背景 颜色 的 调整 或 添加 背景 图 片 ， 进 而 实现 自 定义 版 本 的 面板 (JPanel) 
组 件 。 只 要 完成 如 下 几 步 就 可 以 实现 一 个 简单 自 定义 JPane| 面 板 的 绘制 。 


1) 实现 对 JPanel 面 板 的 继承 ， 代 码 如 下 : 


public class CustomJPanel extends JPanel 


// 更 多 代码 
} 
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~~ 


完成 对 paintComponent (Graphics g) 对 象 的 重 载 ， 代 码 如 下 : 


Protected void paintComponent (Grahpics g) 


// 绘制 代码 


3) 访问 Graphics 绘 制 引 警 ， 设 置 画 笔 颜 色 并 完成 绘制 ， 在 Java 2D 中 paint 支 持 三 种 不 同 的 画笔 颜色 填充 策略 ， 它 们 分 别 是 : 


: 单一 颜色 填充 ， 如 Color BLUE、ColorRED 等 。 代 码 如 下 : 


// 单一 颜色 背景 填充 
g2.setPaint (Color.BLUE) ; 


: 线性 渐变 颜色 填充 (GradientPaint) ， 可 以 细 分 为 水 平 与 竖 直 方向 。 代 码 如 下 : 


// 水 平方 向 线性 渐变 颜色 填充 

Color sencondColor = new Color (99, 153, 255) ; 

GradientPaint hLinePaint = new GradientPaint (0, 0, Color.BLACK, 
this.getWidth () , 0, sencondColor) ; 

g2.setPaint (hLinePaint) ; 

// 紧 直 方向 线性 渐变 颜色 填充 

Color controlColor = new Color (99, 153, 255) ; 

GradientPaint vLinePaint = new GradientPaint (0, 0, Color.BLACK, 
0, getHeight () , controlColor) ; 

g2.setPaint (vLinePaint) ; 


- 圆周 径 向 渐变 颜色 填充 (RadialGradientPaint) 


// 圆周 径 向 渐变 颜色 填充 


oat cx = this.getWidth () / 2; 
float cy - this.getHeight () / 2; 
float radius = Math.min (cx, cy) ; 
Float[] fractions = new float[](0.1f, 0.5f, 1.0f}; 
Color[] colors = new Color[]{Color.RED, Color.GREEN, 
Color.BLUE]; 
// cx, cy 表示 圆周 的 中 心 点 距离 


// radius 表示 半径 长 度 ， 

// fractions 表 示 色 彩 渐变 关键 帧 位 置 ， 每 个 值 取 值 在 0~1 之 间 

// colors 表示 颜色 数组 

RadialGradientPaint rgp = new RadialGradientPaint (cx, cy, 
radius, fractions, colors, CycleMethod.NO CYCLE) ; 

g2.setPaint (rgp) ; 


4) 设置 背景 图 片 支持 。 很 多 时 候 我 们 希望 JjPanel 背 景 
方 就 是 确保 Bufferedlmage 对 象 不 为 NULL。 代 码 如 下 : 


// 图 片 作为 背景 填充 


if (image ! = null) 


{ 
// 0，0 表 示 图 像 起 始 位 置 ， 相 对 于 坐标 为 左上 角 位 置 


g2. drawI [mage (image, 0, 0, getWidth () , getHeight () , null) ; 
} 
5) 实现 一 个 测试 的 main 方 法 代码 如 下 : 
public static void main (String[] args) 
{ 
JFrame ui = new JFrame ("Custom JPanel") ; 
ui.setDefaultCloseOperation (JFrame.EXIT ON CLOSE) ; 
ui.getContentPane () .setLayout (new BorderLayout () ) ; 
ui.getContentPane () .add (new CustomJPanel () , 
BorderLayout.CENTER) ; 
ui.setPreferredSize (new Dim ndo (380, 380) ) ; 
ui.pack () ; 
ui. setVisible (true) ; 
} 
读者 可 以 下 载 相关 文档 查看 完整 的 源 代码 ， 源 代码 是 本 书 的 一 读者 尽量 运 和 


1.4 Swing Java 2D 的 其 他 高 级 特性 介绍 


1.Stroke 接 口 


Stroke 是 Graphics2D 的 API 接 口 ， 用 来 实现 图 形 的 描 边 修饰 ， 在 Java 2D 中 只 有 一 个 


Stroke 的 实现 类 ? 方法 如 下 : 
1) 调用 Graphics2D 的 setStroke () 方法 ， 传 入 一 个 实例 化 的 Stroke 对 象 。 
2) 调用 draw () 方法 ， 传 入 要 绘制 的 几何 形状 。 


Basicstroke 的 对 象 构造 函数 代码 如 下 : 


// 创建 Stroke 对 象 实 例 

float[] dash = {10.0f, 5.0f, 3.0f}; 
Stroke dashed = new BasicStroke (2.0f, 
BasicStroke.JOIN MITER, 10.0f, dash, 


BasicStroke.CAP BUTT, 
0.0£) ; 


其 中 : 


“ 第 一 个 参数 2.0f 表 示 Stroke 的 宽度 。 


:第 二 个 参数 声明 Stoke 的 结束 方式 ，BasicSttoke.CAP_BUTT 表 示 如 果 不 是 闭合 区 域 则 不 做 任何 修饰 ， 直 接 结束 绘 


第 三 个 参数 表示 线 的 连接 方式 ， 此 处 为 JOIN_MITER。 


第 四 个 参数 指定 Stoke 线 段 的 长 度 ， 此 处 线段 长 度 为 10。 


参数 声明 点 线 模式 ， 此 处 点 线 模式 dash 为 不 等 长 线段 。 
参数 声明 位 移 ，0.0 表 示 位 移 间隔 为 零 。 


更 详细 的 参数 说 明 可 以 参考 JDK 的 官方 文档 ， 下 面 的 代码 通过 


// 创建 Stroke 对 象 实例 

float[] dash = {10.0f, 5.0f, 3.0}; 

Stroke dashed = new BasicStroke (2.0f, BasicStroke.CAP SQUARE 

BasicStroke.JOIN MITER, 10.0f, dash, 0.0f) ; 

// 设置 Graphics2D 的 Stroke 对 象 引用 

g2.setStroke (dashed) ; 

// 创建 形状 

Shape rect2D = new RoundRectangle2D.Double (50, 50, 
300, 100, 10, 10); 


g2.draw (rect2D) ; 


2.Texture Fill 接 口 


Texture Fill 即 纹理 填充 ，Graphics2D 提 供 了 setPaint () 方法 来 设置 纹理 填充 ， 
填充 的 类 TexturePaint 创 建 与 使 用 。 


TexturePaint 通 


是 一 张 图 片 而 不 是 颜色 填充 ， 此 时 只 需要 将 Bufferedlmage 对 象 通过 


了 源 代码 ， 


创建 BasicStroke 实 例 对 象 来 绘 


， 支 持 两 种 以 上 的 颜色 渐变 。 代 码 如 下 : 


这 样 可 以 更 好 地 帮助 读者 理解 所 学 内 容 。 


完成 Stroke 接 口 的 类 BasicStroke， 如 果 有 需要 ， 可 以 自己 完成 Stroke 接口 ， 实 现 自 定义 的 stroke 类 


一 个 虚线 矩形 : 


Will () 方法 可 实现 对 几何 形状 的 填充 。 前 面 讲 到 的 两 种 填充 方式 分 


, BasicStroke. CAP ROUND 表示 如 果 不 是 闭合 则 添加 圆 角 帆 线 ， 儿 


drawlmage () 方法 放 在 paintComponent () 中 即 可 ， 唯 一 需要 注意 的 地 


。 如 何 使 用 


> 别 为 颜色 填充 与 渐变 填充 ， 这 里 将 重点 介绍 纹理 


过 构造 一 个 Bufferedlmage 对 象 作 为 纹理 来 填充 几何 形状 ， 因 为 Buffered-Image 对 象 数据 将 被 拷贝 到 TexturePaint 中 ， 所 以 Bufferedlmage 对 象 设 置 得 比较 小 为 好 。 实 例 化 一 个 


TexturePaint 对 象 的 代码 如 下 : 


Rectangle2D rect = new Rectangle2D.Double (10, 10, 200, 200) ; 
TexturePaint tp = new TexturePaint (image, rect) 


其 中 image 表 示 一 个 Bufferedlmage 实 例 ，rect 表 示 截 取 作 为 纹理 的 区 域 。 


使 用 实例 化 的 TexturePaint 来 完成 对 矩 形 区 域 填 充 的 代码 如 下 : 


// Texture Fill 

Rectangle2D rect - new Rectangle2D.Double (10, 10, 200, 200) ; 
TexturePaint tp = new TexturePaint (image, rect) ; 
g2.setPaint (tp) ; 

g2.fill (rect2D) ; 


3.Font 属 性 


Java 2D 支 持 绝 大 多 数 常 见 字体 的 创建 与 属性 值 的 修改 调整 ， 可 通过 Graphics2D setFont () 方法 来 实现 绘制 字体 的 修改 ， 同 时 Graphics2D 绘 制 引擎 还 支持 自 定 义 的 外 部 字体 文件 *:ttf 的 动态 加 载 与 使 
只 要 企 使 用 之 前 加 载 字体 文件 即 可 ， 使 用 下 面 的 代码 可 实现 字体 文件 加 载 : 


o 


public Font loadFont () throws FontFormatException, IOException 
{ 
String fontFileName = "AMERSN.ttf"; 
InputStream is = this.getClass () . 
getResourceAsStream (fontFileName) ; 
Font actionJson = Font.createFont (Font.TRUETYPE FONT, is) ; 
Font actionJsonBase = actionJson.deriveFont (Font.BOLD, 16) ; 
return actionJsonBase; 


字体 加 载 与 使 用 的 完整 代码 如 下 : 


package com.book.chapter.one; 


import java.awt.BorderLayout; 

import java.awt.Color; 

import java.awt.Dimension; 

import java.awt.Font; 

import java.awt.FontFormatException; 
import java.awt.Graphics; 

import java.awt.Graphics2D; 

import java.awt.RenderingHints; 

import java.io.IOException; 

import java.io.InputStream; 

import javax.swing.JFrame; 

import javax.swing.JPanel; 

public class FontDemo extends JPanel { 
private static final long serialVersionUID - 1L; 
public FontDemo () { 


super () ; 
} 
public void paintComponent (Graphics g) 
Graphics2D g2d = (Graphics2D) g; 
// RAB 
setRenderingHint (RenderingHints.KEY ANTIAL 
RenderingHints.VALUE ANTIALIAS ON) ; 

// 设置 画笔 颜色 
g2d.setPaint (Color.BLUE) ; 
try { 

g2d.setFont (loadFont () ) ; 
tch (FontFormatException e) 
e.printStackTrace () ; 
tch (IOException e) 
e.printStackTrace () ; 


{ 


g2d. 


AS 


NG, 


{ 


} ca 


{ 


} ca 


} 
g2d.drawString ("Font Demo", 50) ; 


g2d.dispose () ; // 释放 资源 
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} 
public Font loadFont () 
OException { 

String fontFileName "AMERSN.t 
InputStream is = this.getClass () . 
getResourceAsStream (fontFileName) ; 

actionJson = Font.createFon 
Font.TRUETYPE FONT, is) ; 
tionJsonBase = 


throws FontFormatException, 


Ci. 
»x b 


Fon 


Q 


Font ac 


ac 
urn 


ret 


tionJson.deriveFont (Font.BOLD, 


16) 3 


actionJsonl 


Base; 


} 
public static void main (String[] args) { 

JFrame ui new JFrame ("Font Demo Graphics2D") ; 
ui.setDefaultCloseOperation (JFrame.EXIT ON CLOSE) ; 
L.getContentPane () .setLayout (new BorderLayout () ) ; 

L.getContentPane () .add (new FontDemo () , 
BorderLayout.CENTER) ; 

.setPreferredSize (new Dimension (380, 380) ) ; 
i.pack () ; 
ui.setVisible (true) ; 


4.GeneralPath 与 自 定义 几何 形状 

Java 2D 支 持 通 过 GeneralPath 实 现 绘制 任意 的 几何 形状 ,使 用 GeneralPath 提 供 的 API 接 口 绘制 几何 形状 的 步骤 大 致 如 下 : 
1) 实例 化 GeneralPath 对 象 。 

2) 调用 moveTo () 方法 销 地 开始 点 坐标 。 

3) 调用 lineTo () 或 curveTo 方 法 绘制 连接 线 。 

4) 调用 closePath () 方法 完成 几何 形状 绘制 。 


下 面 的 代码 实现 了 利用 GeneralPath 对 象 绘制 一 个 红色 五 角 星 图 案 。 


package com.book.chapter.one; 


import java.awt.BorderLayout; 
import java.awt.Color; 

import java.awt.Dimension; 

import java.awt.Graphics; 

import java.awt.Graphics2D; 
import java.awt.RenderingHints; 
import java.awt.geom.GeneralPath; 


import javax.swing.JFrame; 

import javax.swing.JPanel; 

public class GeneralPathDemo extends JPanel { 
/* 


* 
*/ 
private static final long serialVersionUID = 1L; 
public GeneralPathDemo () { 

super () ; 


} 
public void paintComponent (Graphics g) { 
Graphics2D g2d = (Graphics2D) g; 

//| BAER 

g2d.setRenderingHint ( 
RenderingHints.KEY ANTIALIASING, 
RenderingHints.VALUE ANTIALIAS ON) ; 
// 五 角 星 的 五 个 点 坐标 


int xl = this.getWidth () / 2; 

int yl - 20; 

int x2 = this.getWidth () / 5; 

int y2 = this.getHeight () - 20; 

int x3 = x2 * 4; 

int y3 = this.getHeight () - 20; 

int x4 = 20; 

int y4 = this.getHeight () / 3; 

int x5 = this.getWidth () - 20; 

int y5 = y4; 

// 定义 画 点 的 顺序 

int xlPoints[] = { xl x2, x5, x4, x3 k 
int ylPoints[] = { yl, y2, y5, y4, y3 h 


// 设置 填充 颜色 

g2d.setPaint (Color.RED) ; 

// 实例 化 GeneralLPath 对 象 

GeneralPath polygon = new GeneralPath ( 
GeneralPath.WIND EVEN ODD, 
xlPoints.length) ; i 

// 锚地 开始 第 一 个 点 

polygon.moveTo (xlPoints[0], ylPoints[0]) ; 

// 顺序 画 出 剩 下 点 

for (int i =1; i < xlPoints.length; i++) { 

polygon.lineTo (xlPoints[i], ylPoints[i]) ; 


// 调用 closePath 形 成 一 个 封闭 几何 形状 

polygon.closePath () ; 

// 绘制 它 

g2d.draw (polygon) ; 

// 释放 资源 

g2d.dispose () ; 

} 
public static void main (String[] args) { 

JFrame ui = new JFrame ("Demo Graphics") ; 
ui.setDefaultCloseOperation (JFrame.EXIT ON CLOSE) ; 
ui.getContentPane () .setLayout (new BorderLayout () ) ; 
ui.getContentPane () .add (new GeneralPathDemo () , 
BorderLayout.CENTER) ; 
ui.setPreferredSize (new Dimension (380, 380) ) ; 
ui.pack () ; 
ui.setVisible (true) ; 


1.5. 小结 


作为 全 书 的 第 一 章 ， 本 章 主 要 介绍 了 Java Swing 中 关于 图 形 GUl 支 持 的 一 些 基 本 概念 与 知识 。 从 Graphics2D 图 形 绘制 引擎 访问 接口 入 手 ， 首 先 介 绍 了 Graphics2D 的 使 用 、 属 性 设置 和 基本 功能 ， 接 着 
介绍 了 Graphics2D 图 形 包 Java 2D 的 基本 API 的 使 用 方法 ， 以 及 几何 图 形 之 间 的 布尔 操作 等 知识 ， 并 以 太极 图 案 为 实例 说 明了 几何 图 形 之 间 布 尔 操作 的 用 法 ， 然 后 介绍 了 如 何 重 载 Swing 非 顶层 组 件 JPanel 的 
paintComponent () 方法 实现 对 JPanel 面 板 自 定义 颜色 填充 ， 以 及 Java 2D 中 颜色 填充 常用 的 对 象 使 用 方法 ， 帮 助 读者 更 好 地 理解 使 用 Java 进行 图 形 绘制 的 基本 方法 与 步骤 。 最 后 介绍 了 在 Graphics2D 中 
如 何 设置 字体 ， 设 置 stroke 风 格 ， 设 置 背景 填充 纹理 等 高 级 知识 点 ， 此 外 ， 还 给 出 了 GeneralPath 对 象 的 使 用 方法 ， 实 现 了 任意 几何 形状 的 绘制 。 


Graphics2D 作 为 绘制 引擎 接口 ， 已 经 提供 了 当前 编程 语言 图 形 包 中 所 能 提供 的 几乎 所 有 功能 ， 常 见 图 形 包 中 都 有 draw 与 i， 都 会 用 到 Texture、Stroke 等 属性 设置 ， 都 会 涉及 字体 加 载 与 使 用 ， 但 是 本 
章 并 没有 对 Graphics2D 中 图 形 错 切 、 旋 转 与 放 缩 、 几 何 图 形 的 透明 混合 规则 等 进行 探讨 ， 感 兴趣 的 读者 可 以 自己 去 做 更 进一步 的 研究 。 


第 2 章 Java Bufferedlmage 对 象 及 其 支持 的 API 操 作 


第 1 章 我 们 一 起 学 习 了 Java 中 的 Graphics 图 形 包 基本 概念 与 知识 ， 本 章 将 介绍 Java 中 关于 图 像 文 件 操作 的 基本 知识 。 首 先是 Java 2D 图 像 对 象 Bufferedlmage 的 组 件 构成 、 与 图 像 文件 之 间 的 关系 、 格 式 
支持 ， 以 及 如 何 利用 Bufferedlmage 对 象 在 Java 语 言 中 实现 像素 读 写 操 作 。 然 后 通过 BufferedlmageOp 接 口 介绍 Java 中 几 种 非常 有 用 的 对 像素 操作 的 Buffered-ImageOp 的 实现 类 。 最 后 将 集合 上 述 知识 
点 ， 实 现 一 个 简单 Java Swing 的 滤 镜 程序 ， 帮 助 读 者 实现 学 以 致 用 ， 加 深 理 解 。 


在 介绍 本 章 内 容 之 前 ， 笔 者 假设 你 已 经 掌握 了 基本 Java 语 言 编程 知识 ， 学 习 过 简单 的 Swing 程序 ， 同 时 对 图 像 文件 的 格式 及 其 特点 有 一 些 简单 的 了 解 。 这 些 知识 点 可 以 帮助 你 更 好 地 学 习 本 章 内 容 。 


2.1 _ Bufferedlmage 对 象 的 构成 


Bufferedlmage 是 一 个 内 存 对 象 ， 当 通过 ImagelO.read () 方法 读 取 一 个 图 像 文 件 时 ， 读 取 到 的 关于 图 像 文 件 的 所 有 信息 都 会 被 存储 在 该 API 返 回 的 Bufferedlmage 内 存 对 象 中 。 此 外 还 可 以 通过 
Bufferedlmage 类 的 构造 函数 来 创建 Bufferedlmage 内 存 对 象 。Bufferedlmage 对 象 中 最 重要 的 两 个 组 件 为 Raster 与 ColorModel， 分 别 用 于 存储 图 像 的 像素 数据 与 颜色 数据 ，Bufferedlmage 中 的 其 他 属 
性 还 包括 宽 、 高 、 图 像 类 型 等 。 当 需要 对 Bufferedlmage 对 象 实现 一 些 像 素 级 别 的 操作 时 ， 调 用 Raster 对 象 总 是 有 点 道理 ， 如 果 做 个 形象 的 比喻 ，Raster 就 好 像 一 个 像素 操作 的 场地 ， 任 何 像素 读 写 操作 都 
可 以 通过 调用 Raster 相 关 接 口 来 完成 。 一 个 完整 的 Bufferedlmage 构 成 类 关系 图 如 图 2-1 所 示 。 


图 2-1 BufferedImagext RK AB 


2.2 Java BufferedlmageOp API 


本 节 将 介绍 Java 中 最 党 用 的 操作 图 像 像素 的 API 接 口 BufferedlmageOp， 通 过 它 ， 可 以 实现 图 像 像素 的 调整 ， 呈 现 出 不 同 的 图 像 显示 效果 ， 并 且 可 编辑 图 像 内 容 等 。 


23 ”基于 BufferedImageOp 的 图 像 滤 镜 演示 

通过 前 面 两 节 的 学 习 ， 我 们 已 经 大 致 了 解 BufferedlmageOp 接 口 及 其 实现 类 的 功能 。 实 践 出 真知 ， 本 节 将 演示 BufferedlmageOp 接 口中 每 个 实现 类 的 实际 使 用 场景 ， 达 到 知行 合 一 、 学 以 致 的 目 
的 ， 帮 助 大 家 解决 项 目 中 遇 到 的 实际 问题 。 为 了 让 大 家 对 应 用 效果 有 更 加 深刻 的 印象 ， 下 面 会 使 用 BufferedimageOp 的 实现 类 来 实现 如 下 几 个 滤 镜 特效 功能 。 

RORE: 将 彩色 图 像 自动 转换 为 思 白 两 色 图 像 。 

ARRE: 将 彩色 图 像 自动 转换 为 友 度 图 像 。 

BAR: 使 图 像 产生 模糊 效果 。 

ARRE: AL EURAL & SUC. 

1.UI 实 现 部 分 


在 介绍 基于 Swing 的 UI 实 现时 ， 关 于 Swing UI 部 分 的 编程 知识 将 在 下 一 章 中 详细 剖析 与 解释 ， 本 节 的 重点 放 在 渡 镜 实现 部 分 ， 大 致 的 UI 布局 如 图 2-3 所 示 。 


JFrameX]Z? | | JPanebd [C] JButon 对 象 


图 2-3 ”实现 界面 
2. 滤 镜 部 分 的 实现 
(1) ColorConvertOp 实 现 灰 度 功能 


ColorConvertOp 主 要 用 于 实现 各 种 色彩 空间 的 转换 ， 从 而 达到 转换 Bufferedlmage 对 象 类 型 的 目的 ， 也 可 以 在 实例 化 ColorConvertOp 对 象 时 指定 色彩 空间 。 当 前 支持 的 色彩 空间 有 五 种 ， 实 现 灰 度 功 
能 时 ， 只 需 在 实例 化 ColorConvertOp 时 指定 色彩 空间 为 ColorSpace.CS_GRAY， 然 后 调用 它 的 filter 方 法 得 到 返回 图 像 即 可 。 灰 度 化 的 源 代码 如 下 : 


public BufferedImage doColorGray (BufferedImage bi) 
{ 


ColorConvertOp filterObj = new ColorConvertOp ( 
ColorSpace.getInstance (ColorSpace.CS GRAY) , null) ; 
return filterObj.filter (bi, null) ; 


(2) LookupOp 实 现 黑白 功能 


LookupOp 在 实例 化 时 需要 传 入 LookupTable 实 例 ， 当 前 LookupTable 接 口 的 两 个 实现 类 分 别 为 ByteLookupTable 与 ShortLookupTable。 类 关系 图 2-4 可 以 很 好 地 说 明 它 们 之 间 的 关系 。 


LookupTable <<Abstract Class>> 
iia LookupTable 


- ltable:LookupTable | 只 + lookupPixel():void 


ByteLookupTable ShortLookupTable 


+ lookupPixel():void + lookupPixel():void 


图 2-4 LookupTabled£ 7-4 FM KAM X A 


运用 LookupOp 实 现 彩色 图 像 变 成 黑白 单 色 图 像 的 功能 时 ， 首 先 要 将 图 像 灰 度 化 ， 然 后 针对 灰 度 图 像 在 LookupTable 中 根据 像素 值 进行 索引 查找 ， 以 便 设 置 新 的 像素 值 ， 从 而 得 到 黑白 单 色 图 像 ， 代 码 


如 下 : 


public 


{ 
bi 


fo 


{ 


BufferedImage doBinary] 


= doColorGray (bi) ; 
byte[] threshold = 


r (int i=0; i « 256; 


threshold[i] = 


ne 


new byte[256]; 


(i < 


i++) 


128) ? (byte) 0 


feredImageOp thresholdOp = 
w LookupOp (new ByteLookupTable (0, 


[mage (BufferedImage bi) 


(byte) 255; 


threshold) , null) ; 


turn thresholdoOp. .: 


Filter (bi, 


null) ; 


(3) ConvolveOp 实 现 模糊 功能 


ConvolveOp 是 实现 模板 卷 积 功能 操作 的 类 ， 通 过 简单 设置 卷 积 核 / 卷 积 模板 就 可 以 实现 图 像 模 糊 功能 ， 实 现代 码 如 下 : 


loat 


ninth = 1.0f / 
loat[] blurKernel = 


OT 
{ 


ninth, ninth, ninth, 
ninth, ninth, ninth, 
ninth, ninth, ninth 


3, blurKernel) ) ; 


BufferedlmageOp blurFilter = 
new ConvolveOp (new Kernel (3, 
return blurFilter.filter (bi, null) ; 


但 是 当 你 想 对 大 多 数 JPG 格 式 图 片 的 Bufferedlmage 对 象 实现 模糊 功能 时 ， 很 多 情况 下 Java 会 抛 出 如 下 和 


unable to convolve src image 


原因 在 于 JDK 读 入 JPG 格 式 图 像 时 ， 多 数 情 况 下 使 用 了 TYPE_3BYTE_BGR 和 存储 方式 ， 而 BufferedlmageOp 实 现 的 渡 镜 不 支持 操作 该 存储 方式 的 Bufferedlmage 对 象 ， 这 样 就 导致 了 上 面 的 错误 。 


道 很 简单 ， 就 是 通过 ColorConvertOp 把 图 像 从 类 型 TYPE 3BYTE_BGR 转 换 为 TYPE INT_RGB 的 Bufferedlmage 对 象 。 所 以 模糊 功能 的 


public 


{ 
2 
if 


{ 


feredImage. 


bi=convertType (bi, 


} 


loat ninth = 1.0f / 9 


loat[] blurKernel = { 


ninth, ninth, 
ninth, ninth, 
ninth, ninth, 


re 


Büf 


.Of; 


ninth, 
ninth, 
ninth 


FeredlImageOp blurFilter = 
new ConvolveOp (new Kernel (3, 


turn blurFilter.filter (bi, 


convertType 方 法 的 代码 如 下 : 


ColorC 


onvertOp cco-new Co 


Buffer 


edlImage dest=new Buf 


feredImage ( 


BufferedImage doBlur (BufferedImage bi) 


fix issue - unable to convolve src image 
(bi.getType () ==Buf 


TYPE 3BYTE BGR) 


Bufferedlmage.TYPE INT RGB) ; 


3, blurKernel) ) ; 


null) ; 


lorConvertOp (null) ; 


src.ge 


tWidth () , 


src.getHeight () , 


type) ; 


cco.filter (src, 
return dest; 


dest) ; 


(4) AffineTransformOp 实 现 图 像 zoom in/out 的 功能 


AffineTransformOp 支 持 的 操作 包括 图 像 的 错 切 、 旋 转 、 放 缩 、 平 黎 。 要 实现 图 像 的 放 缩 功能 ， 首 先 要 通过 AffineTransform.getScalelnstance 来 获取 Scale 实 例 ， 然 后 作为 参数 初始 化 
AffineTransformOp 对 象 实例 ， 最 后 调用 filter 方 法 即 可 。 实 现 图 像 放 缩 功 能 的 代码 如 下 : 


public BufferedImage doScale (Bufferedl 
double sx, double sy) 


{ 


AffineTransformOp ati 


[mage bi, 


// 计 算 放 缩 后 图 像 的 宽 与 高 


fFilter = new AffineTransformOp ( 
AffineTransform.getScaleInstance (sx, sy) , 
AffineTransformOp.TYPE BILINEAR) ; 


R) ; 


int nw = (int) (bi.getWidth () * 
int nh = (int) (bi.getHeight () * sy) ; 


result = new Bu 


BufferedImage 
nw, nh, 
/ / ERA 


SX) ; 


feredImage ( 


Buf 


atfFilter.filter (bi, result) ; 


return result; 


feredImage.TYPE 3BYTE BGR) ; 


完整 


源 代码 如 下 : 


需要 传 入 的 三 个 参数 包括 : bi 是 Bufferedlmage 对 象 实例 ， 代 表 要 放 缩 的 图 像 ，sx 表 示 在 X 方 向 的 放 缩 比率 ;sy 表示 在 Y 方 向 的 放 缩 比率 。 


完整 的 Ul 部 分 代码 如 下 : 


package com.book.chapter.two; 
import java.awt.BorderLayout; 
import java.awt.Dimension; 
import java.awt.FlowLayout; 
import java.awt.event.ActionEvent; 
import java.awt.event.ActionListener; 
import java.awt.image.BufferedImage; 
import java.io.File; 
import java.io.IOException; 
import javax.imageio.ImageIO; 
import javax.swing.JButton; 
import javax.swing.JFileChooser; 
import javax.swing.JFrame; 
import javax.swing.JOptionPane; 
import javax.swing.JPanel; 
public class MyFilterUI extends JFrame 
implements ActionListener { 
/** 
* 
*/ 


private static 


public s 
public s 


final long serialVersionUID = 1L; 


tatic final 


nn 


tatic final 


tring BINAI 


tring GRAY CMD = "KE"; 
RY CMD = "Ze"; 


解决 之 


public static final String BLUR CMD = "模糊 "; 
public static final String ZOOM CMD = " 放 缩 "; 
public static final String BROWSER CMD = "i&ithttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/OEBPS/Text/..."; 
private JButton grayBtn; 

private JButton binaryBtn; 

private JButton blurBtn; 

private JButton zoomBtn; 

private JButton browserBtn; 

private MyFilters filters; 

// image 

private BufferedImage srcImage; 

public MyFilterUI () 


{ 
this.setTitle ("JAVA 2D BufferedImageOp - 滤 镜 演示 ") ; 
grayBtn = new JButton (GRAY CMD) ; 
binaryBtn - new JButton (BINARY CMD) ; 
blurBtn = new JButton (BLUR CMD) ; 

zoomBtn = new JButton (ZOOM CMD) ; 

browserBtn = new JButton (BROWSER CMD) ; 

// buttons 

JPanel btnPanel = new JPanel () ; 

tnPanel.setLayout (new 

FlowLayout (FlowLayout.RIGHT) ) ; 

btnPanel.add (grayBtn) ; 

btnPanel.add (binaryBtn) ; 

b . 

b 


o 


tnPanel.add (blurBtn) ; 

tnPanel.add (zoomBtn) ; 

btnPanel.add (browserBtn) ; 

// filters 

filters - new MyFilters () ; 

getContentPane () .setLayout (new BorderLayout () ) ; 
getContentPane () .add (filters, BorderLayout.CENTER) ; 
getContentPane () .add (btnPanel, BorderLayout.SOUTH) ; 
// setup listener 

setupActionListener () ; 


} 

private void setupActionListener () { 
grayBtn.addActionListener (this) ; 
binaryBtn.addActionListener (this) ; 
blurBtn.addActionListener (this) ; 
zoomBtn.addActionListener (this) ; 
browserBtn.addActionListener (this) ; 


} 


@Override 
public void actionPerformed (ActionEvent e) { 
if (srcImage == null) 


{ 


JOptionPane. showMessageDialog (this, 
"请 先 选择 图 像 源 文 件 ") ; 
try { 
JFileChooser chooser = new JFileChooser () ; 
chooser.showOpenDialog (null) ; 
File f = chooser.getSelectedFile () ; 
srcImage = ImagelO.read (f) ; 
filters.setImage (srcImage) ; 
filters.repaint () ; 
) catch (IOException el) { 
el.printStackTrace () ; 


} 


return; 


E 


if (GRAY CMD.equals (e.getActionCommand () ) ) 
{ 


ilters.doColorGray (srcImage) ; 
ilters.repaint () ; 


else if (BINARY CMD.equals (e.getActionCommand () ) ) 


ilters.doBinaryImage (srcImage) ; 
ilters.repaint () ; 


else if (BLUR CMD.equals (e.getActionCommand () ) ) 


ilters.doBlur (srcImage) ; 
ilters.repaint () ; 


else if (ZOOM CMD.equals (e.getActionCommand () ) ) 


ilters.doScale (srcImage, 1.5, 1.5) ; 
ilters.repaint () ; 


else if (BROWSER CMD.equals (e.getActionCommand () ) ) 


try { 
JFileChooser chooser = new JFileChooser () ; 
chooser.showOpenDialog (null) ; 
File f = chooser.getSelectedFile () ; 
srcImage = ImagelO.read (f) ; 
filters.setImage (srcImage) ; 
ilters.repaint () ; 
) catch (IOException el) { 
el.printStackTrace () ; 


} 

} 

} 

public static void main (String[] args) { 
MyFilterUI ui = new MyFilterUI () ; 
ui.setDefaultCloseOperation (JFrame.EXIT ON CLOSE) ; 
ui.setPreferredSize (new Dimension (800, 600) ) ; 
ui.pack () ; 
ui.setVisible (true) ; 


这 里 主要 是 基于 JFframe 对 象 实现 Ul 部 分 ， 通 过 重 载 JPanel 的 paintComponent () 方法 来 显示 原 图 与 处 理 后 的 效果 图 。 按 钮 动作 响应 通过 监听 ActionListener 来 实现 ， 处 理 完 以 后 通过 调用 
repaint () 方法 来 实现 UI 刷新 。 


24 ”小结 


本 章 重 点 介绍 了 Java 2D 中 关于 图 像 方面 的 操作 接口 类 BufferedlmageOp， 通 过 其 实现 类 可 以 很 方便 地 实现 图 像 的 色彩 空间 转换 ， 自 定义 颜色 查找 表 ， 卷 积 功能 (包括 边缘 提取 、 线 性 模糊 、 高 斯 模 
糊 ) ， 图 像 的 放大 与 缩小 、 错 切 变化 、 平 移 变换 、 旋 转变 换 等 。 最 后 本 章 通过 编码 实现 了 几 种 简单 而 且 常见 的 图 像 处 理 功能 ， 帮 助 读 者 加 深 对 BufferedImageOp 接 口 的 认识 。 如 果 你 还 想 更 加 深入 地 了 解 
BufferedlmageOp 接 口 实现 类 的 使 用 ， 请 参照 JDK 官 方 文档 说 明 ， 同 时 建议 你 多 多 编程 实践 ， 只 有 加 深 认 知 才能 更 好 地 掌握 与 运用 BufferedlmageOp 实 现 类 的 功能 。 


第 3 章 “ 基 本 Swing UI 组 件 与 图 像 显 示 


上 一 章 介绍 了 BufferedlmageOp 的 一 些 重要 知识 ， 实 现 了 几 个 常见 的 图 像 特 效 ， 本 章 介 绍 如 何 通过 Swing UI 组 件 显示 与 刷新 图 像 。 首 先 会 介绍 JAVA Swing 的 顶层 组 件 jFrame， 然 后 介绍 Swing 中 最 
重要 和 使 用 频率 最 高 的 组 件 JPanel， 教 会 读者 重 写 JComponent 中 的 paintComponent () 方法 来 实现 图 像 的 显示 ， 最 后 会 介绍 Swing 组 件 JButton 捕 获 与 监听 用 户 行为 时 最 重要 的 ActionListener 接 口 的 使 
用 ， 以 及 在 Swing 事件 派 遗 线程 中 刷新 显示 等 的 技巧 ， 希 望 可 指导 读者 在 后 续 的 图 像 处 理 实践 中 ， 通 过 Swing UI 来 实现 自己 的 UI 测试 类 。 本 书 不 是 一 本 专门 介绍 Java Swing 编程 的 图 书 ， 因 此 要 求 读者 对 
Java Swing 常见 组 件 有 基本 认识 ， 对 Swing 事件 监听 与 处 理 有 基本 的 知识 。 


本 章 最 主要 的 目的 是 实现 一 个 Java Swing UI， 即 一 个 测试 框架 ， 来 测试 第 4 章 到 第 13 章 中 所 有 继承 自 AbstractBufferedlmageOp 抽 象 类 的 源 代 码 ， 帮 助 读 者 更 好 地 理解 所 学 到 的 关于 图 像 处 理 的 知识 
与 内 容 。 


3.1 JpPanel 组 件 与 Bufferedlmage 对 象 的 显示 


刚 接触 Swing 编程 的 读者 可 能 对 JPanel 的 了 解 并 不 多 ， 常 常 不 清楚 如 何在 JPanel 中 显示 图 像 ， 而 网 上 的 很 多 教程 又 是 通过 JLabel 来 作为 Bufferedlmage 实 例 显示 组 件 的 ， 这 其 实 不 是 一 种 很 好 的 方法 ， 
不 值得 推荐 。 在 JPanel 中 显示 Bufferedlmage 对 象 实例 时 ， 值 得 推荐 的 做 法 应 该 是 通过 重 载 paintComponent () 方法 来 实现 图 像 的 显示 与 及 时 刷新 。 这 种 方法 的 大 致 实现 可 以 分 为 以 下 几 步 。 


1) 重 载 JPanel 中 的 paintComponent () 方法 。 


2) 获取 Graphics2D 图 形 引 警 绘制 对 象 ， 使 用 drawlmage 方 法 绘制 图 像 ， 代 码 如 下 : 


protected void paintComponent (Graphics g) { 
Graphics2D g2d = (Graphics2D) g; 
g2d.clearRect (0, 0, this.getWidth () , 
this.getHeight () ) ; 
if (sourceImage ! = null) 


g2d.drawImage (sourceImage, 0, 0, 
sourcelmage.getWidth () , 
sourcelImage.getHeight () , null) ; 

f (destImage ! - null) 


=~ H- 


g2d.drawImage (destImage, 
sourcelImage.getWidth () + 10 , 
0, destImage.getWidth () , 
destImage.getHeight () , null) ; 


3) 使 用 repaint () 方法 及 时 绘制 更 新 。 
以 上 简单 的 三 步 即 可 实现 Bufferedlmage 对 象 实例 在 JPanel 的 现实 与 刷新 。 


根据 上 述 方 法 实现 了 一 个 完整 的 可 以 显示 与 刷新 Bufferedlmage 对 象 实例 的 ImagePanel 类 ， 代 码 如 下 : 


package com.book.chapter.three; 
import java.awt.Graphics; 
import java.awt.Graphics2D; 
import java.awt.image.BufferedImage; 
import javax.swing.JPanel; 
public class ImagePanel extends JPanel { 

private static final long serialVersionUID - 1I 

private BufferedImage sourcelmage; 

private BufferedImage destImage; 

public ImagePanel () 


{ 
} 


@Override 
protected void paintComponent (Graphics g) { 
Graphics2D g2d = (Graphics2D) g; 
g2d.clearRect (0, 0, this.getWidth () , 
this.getHeight () ) ; 
if (sourceImage ! = null) 
{ 


// do nothing 


g2d.drawImage (sourceImage, 0, 0， 
sourcelImage.getWidth () , 
sourcelImage.getHeight () , null) ; 
if (destImage ! = null) 


{ 


g2d.drawImage (destImage, 
sourceImage.getWidth () + 10 
0, destImage.getWidth () , 
destImage.getHeight () , null) ; 


和 


} 


} 
public BufferedImage getSourceImage () { 
return sourceImage; 


} 
public void setSourceImage (BufferedImage sourceImage) { 
this.sourcelmage = sourcelmage; 


} 
public BufferedImage getDestImage () { 
return destImage; 


} 
public void setDestImage (BufferedImage destImage) { 
this.destImage = destImage; 


3.2 JFrameZ8{45Main UI 实现 


要 想 真 正 把 读 入 图 像 的 Bufferedlmage 对 象 实例 显示 到 UI 上 为 眼睛 所 见 ， 还 需要 使 用 JFrame 组 件 ， 把 JPanel 组 件 实例 通过 add () 方法 加 到 JFrame 的 内 容 面板 上 。 在 Java Swing 中 只 有 JFrame、 
JDialog 与 JApplet 属 于 顶层 容器 ， 其 他 组 件 最 终 必 须 依 附 于 顶层 容器 才能 够 正确 显示 ， 使 用 下 rame 来 显示 JPanel 与 Bufferedlmage 对 象 实 例 大 致 可 以 通过 如 下 几 步 实现 。 


1) 在 JPanel 中 通过 重 载 JComponent 的 paintComponent () 方法 绘制 Bufferedlmage 实 例 。 


2) 获取 JFrame 的 内 容 面 板 ， 这 里 使 用 的 布局 管理 器 为 BorderLayout， 然 后 把 JPanel 实 例 添加 到 JFrame 的 内 容 面板 中 ， 代 码 如 下 : 


// JPanel 实例 对 象 添加 到 JErame 的 内 容 面板 上 
imagePanel = new ImagePanel () ; 


getContentPane () .setLayout (new BorderLayout () ) ; 
getContentPane () .add (imagePanel, BorderLayout.CENTER) ; 


3) 通过 JFrame 的 setVisible () 方法 来 实现 上 frame 的 显示 ， 通 过 setPreferredSize () 方法 来 控制 JjFrame 组 件 的 大 小 。 代 码 如 下 : 


setDefaultCloseOperation (JFrame.EXIT ON CLOSE) ; 
setPreferredSize (new Dimension (800, 600) ) ; 

pack () ; 
setVisible (true) ; 


3.3 JFileChoose 文 件 选择 框 的 使 用 


介绍 Swing 中 的 JFileChoose 文 件 选择 框 是 因为 我 们 经 常会 用 来 它 实现 选择 本 地 图 片 文件 ， 然 后 加 载 到 JPanel 组 件 中 显示 ，JFileChoose 组 件 类 的 使 用 方法 极其 简单 ， 只 要 简单 的 三 行 代码 就 可 以 提供 相 
应 的 文件 选择 对 话 框 ， 代 码 如 下 : 
JFileChooser chooser = new JFileChooser () ; 


chooser.showOpenDialog (null) ; 
File f = chooser.getSelectedFile () ; 


如 果 想 在 文件 选择 对 话 框 中 只 看 到 指定 类 型 的 文件 ， 则 可 以 通过 setFileFilter () 来 实现 。 一 个 最 简单 的 支持 选择 图 像 格 式 文件 的 FileFilter 示 例 的 代码 如 下 : 


T 


FileNameExtensionFilter filter = 

new FileNameExtensionFilter ( 

"JPG & PNG Images", "jpg", "png") ; 
chooser.setFileFilter (filter) ; 


这 样 就 可 以 实现 文件 类 型 的 过 滤 了 ， 在 打开 时 只 会 看 到 JPG 与 PNG 格 式 的 图 片 文 件 ， 其 他 类 型 文件 则 会 被 自动 过 滤 。 从 上 述 代 码 也 可 以 看 到 ， 在 Java Swing 中 使 用 文件 选择 框 是 非常 简单 与 方便 的 。 


3.4 基本 JButton 事 件 啊 应 


在 学 习 JButton 事 件 响应 的 知识 之 前 ， 首 先 来 看 一 下 Swing 中 如 何 实现 对 用 户 事 件 的 监听 与 处 理 ， 认 识 一 下 Swing 中 事件 响应 最 重要 的 线程 一 一 事件 分 派 线程 。 


在 Swing 中 有 一 个 特殊 的 线程 被 称 为 Swing 事 件 分 配 线程 ， 如 果 对 UI 组 件 的 操作 不 在 Swing 事 件 分 派 线 程 中 ，Swing 将 抛 出 异常 。 检 测 当 前 线程 是 否 为 事件 分 派 线程 可 以 通过 Swing 本 身 提供 的 一 个 简单 
方法 SwingUtilities.isEventDispatchThread () 来 完成 。 对 Swing UI 组 件 的 刷新 、 重 绘 等 必须 都 在 事件 分 派 线程 中 完成 ， 这 是 因为 Swing 组 件 本 身 的 设计 不 是 线程 安全 的 ， 所 以 通过 一 个 特殊 的 线程 一 一 事 
件 分 派 线 程 来 实现 对 所 有 组 件 的 更 新 与 重 绘 ， 这 样 就 保证 了 Swing 组 件 操作 的 线程 安全 性 。 


JButton 组 件 是 Java Swing 中 实现 用 户 交 互 最 常用 的 组 件 ， 当 用 户 单 击 对 应 的 JButton 组 件 时 ，Swing 通 过 监听 组 件 添加 ActionListener 对 象 实例 ， 来 实现 对 JButton 组 件 单 击 事件 的 监听 与 响应 处 理 ， 
其 响应 处 理 则 通过 实现 ActionListener 接 口 的 actionPerformed () 方法 来 完成 。 很 多 时 候 ， 在 单 击 JButton 按 钮 以 后 ， 昌 然 有 很 多 事情 要 做 ， 但 还 是 希望 UI 可 以 继续 响应 用 户 操作 ， 这 时 可 使 用 
SwingWeork 来 完成 用 户 的 操作 并 刷新 UI 显 示 。 


在 对 Swing 事件 响应 机 制 有 初步 了 解 以 后 ， 下 面 看 一 下 在 正式 的 项 目 编程 中 Swing 如 何 实现 对 JButton 事 件 监听 与 响应 。 其 实现 过 程 大 致 可 以 分 为 两 步 完成 。 
1) 实现 ActionListener 接 口 ， 最 常见 的 是 由 定义 JButton 组 件 的 类 来 实现 ActionListener 接 口 。 


2) 根据 ActionEvent.getActionCommand () 得 到 的 文本 常量 响应 相应 的 用 户 操作 。 


3.5 一 个 完整 的 Swing Ul Demo 


本 节 将 根据 前 面前 四 节 所 讲 的 Swing UI 组 件 应 用 知识 ， 实 现 一 个 真正 的 Swing UI 演示 ， 以 更 加 贴近 实际 编程 的 方式 来 说 明 Swing 中 组 件 的 应 用 知识 。 首 先 来 介绍 一 下 要 实现 的 功能 : 
- 通过 文件 对 话 框 选 择 图 像 文件 ， 刷 新 JFrame 中 的 内 容 面 板 实现 图 像 显 示 。 
- 通过 单 击 [处 理 ] 按 钮 实现 对 图 像 的 必要 处 理 ， 然 后 刷新 显示 图 像 。 


大 致 的 UI 组 件 布 局 如 图 3-1 所 示 。 


二 一 JFrame£H f^: 


其 中 支持 Bufferedlmage 对 象 显示 的 自 定义 JPane| 类 的 实现 如 下 : 


package com.book.chapter.three; 


import java.awt.Graphics; 
java.awt.Graphics2D; 


impor! 


import java.awt.image.BufferedImage; 


import javax.swing.JPane] 
ImagePanel extends JPanel { 


public class 


/** 
* 


*7 


=. 


private static final long serialVersionUID = 1L; 


private BufferedImage sourcelmage; 


private BufferedImage destImage; 


public ImagePanel () { 


) 


QOverride 


protected void paintComponent (Graphics g) { 


Graphics2D g2d - 


g2d.clearRect (0, 0, 


if (s 


this.getWidth () , 
this.getHeight () ) ; 


ourceImage ! = null) 


(Graphics2D) g; 


{ 


g2d.drawImage (sourceImage, 0, 0， 
sourcelImage.getWidth () , 


} 


sourcelmage.get 
if (destImage ! = null) 


g2d.drawImage (dest 


destImage.getWidth 


Height () , null) ; 
{ 


Image, 
sourcelmage.getWidt 


h © +10, 0, 


oS 
M— 


destImage.getHeight ©) 5 ull; 


} 
public void process () 


// do nothing 


} 
public BufferedImage getSourceImage () { 
return sourcelmage; 


} 
public void setSourceImage (BufferedImage sourceImage) 


this.destImage = destImage; 


this.sourcelmage = sourcelmage; 
} 
public BufferedImage getDestImage () { 
return destImage; 
} 
public void setDestImage (BufferedImage destImage) { 


| JPanel?H f 


图 3-1 


UI 布局 结构 


Tt 


swingUl 界 面 实 现 与 JButton 按 钮 监听 处 理 的 类 的 代码 如 下 : 


package com.book.chapter.three; 
import java.awt.BorderLayout; 


import 
import 


java.awt 


java.awt.Dimension; 


.FlowLayout; 


» 


impor! 
import 
import 
import 
import 
import 
import 
import 
import 
import 
import 
import 
import 


ava 


ava 


fa Lie Lele C Is Le be C. Le Le Loe Loe 


eT cr ¢T CT CT CT CT CT OCF CT OCT cr cr 


.awt.event.ActionEvent; 


ava. 
ava. 


awt.event.Actionl 


awt.image. 


Bu 


.io.File; 


ava. 


avax.swin 
avax.swin 
public class Main 
implements 


io.IOExcep! 


tion; 


avax.imageio.ImageIlO; 


avax.swing.JBu! 
avax.swin 
avax.swin 
avax.swin 


JOp! 


tton; 
JFileChooser; 
JFrame; 
tionPane; 


SwingUtilities; 


filechooser.FileName 


Listener; 
feredImage; 


g. 
g. 
g. 
avax.swing.JPanel; 
g. 
g. 
U] 


ExtensionFilter; 


[ extends JFrame 
Actionl 


Listener { 


private static final long serialVersionUID = 1L; 


public static final 
public static final 


String IMAG 


ImagePanel imagePanel; 


private JButton img 
private JButton processBtn; 
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} 


if 
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System.out.prin 


srcImage == null) 
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men 
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L.add (processBtn) ; 
filters 
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Formed (ActionEvent e) { 
tchThread () ) 


Dispath Thread! ! ") ; 


JOptionPane.showMessageDialog (this, 


"请 先 选 择 图 像 源 文件 ") 5 


try { 


JFileChooser chooser = 


new JFileChooser () ; 


setFileTypeFilter (chooser) ; 
chooser.showOpenDialog (null) ; 


File f = chooser.getSelectedFile () ; 
Tf (f 1 — null) 
{ 
srcImage = ImageIO.read (f) ; 
imagePanel.setSourceImage ( 
srcImage) ; 
imagePanel.repaint () ; 


} 
) catch (1 


} 


return; 


} 


else it 


{ 


} 
} 


public void setFileTypeFilter (JFileChooser chooser) 
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try { 
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JFileChooser chooser - 
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new JFileChooser () ; 


setFileTypeFilter (chooser) ; 
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File f = chooser.getSelectedFile () ; 
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imagePanel.setSourceImage ( 
srcImage) ; 
imagePanel.repaint () ; 
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IOException el) { 


el.printStackTrace () ; 


} 


imagePanel.repaint () ; 
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PNG Images", 
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public void openView () 
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本 章 一 步 一 步 地 剖析 如 何 了 构建 一 个 Swing UI 程序， 介绍 了 JPanel、JButton、JFile-Chooser 等 组 件 的 用 法 ， 最 后 通过 JFrame 组 件 组 合成 为 用 户 交 互 界面 ， 实 现 了 对 图 像 文 件 的 显示 与 操作 ， 以 及 UI 
响应 用 户 的 操作 与 刷新 。 这 也 是 本 书后 面 多 数 章节 中 要 用 到 的 测试 Ul， 所 以 学 习 与 掌握 本 章 知 识 ， 将 为 后 面 图 像 处 理 的 代码 提供 一 个 UI 现实 与 效果 演示 


界面 ， 帮 助 读者 加 深 对 知识 的 理解 。 前 面 三 章 已 经 介 


绍 了 Java 图 像 处 理 API 基 础 知识 与 Swing 的 基础 知识 ， 这 为 后 面 学 习 图 像 处 理 做 了 很 好 的 铺垫 ， 特 别 是 其 中 的 像素 操作 方法 ， 这 将 在 后 面 的 编程 中 一 直 使 用 。 


本 章 的 主要 目的 不 是 介绍 Swing 编程 知识 ， 如 果 读 者 对 Swing 编程 感 兴趣 的 话 ， 可 以 阅读 JDK 官 方 关 于 Swing 编程 的 技术 文档 。 


第 4 章 图 像 属性 


前 三 章 讲 的 是 Java 图 形 编程 与 Swing 的 基础 知识 ， 本 章 开 始 我 们 将 注意 力 放 到 图 像 处 理 本 身 。 直 观 地 进 ， 图 像 属性 可 以 指 图 像 的 大 小 即 字 节 数 、 图 像 的 宽 与 高 、 位 图 的 深度 、 图 像 的 压缩 与 存储 格式 
等 ， 进 一 步 提取 的 话 可 以 包括 图 像 的 色彩 空间 、 图 像 的 直方 图 、 亮 度 、 像 素 值 、 透 明 通道 等 。 图 像 的 这 些 属 性 是 它 最 重要 的 基础 数据 ， 在 了 解 图 像 这 些 属 性 的 基础 上 ， 通 常 我 们 可 以 通过 改变 图 像 的 这 些 属 
性 值 来 实现 对 图 像 处理 ， 从 而 达到 想 要 的 各 种 结果 。 本 章 的 内 容 就 是 先 介 绍 这 些 属性 ， 然 后 通过 改变 这 些 属性 实现 对 图 像 一 些 简单 处 理 ， 从 而 达到 不 同 的 视觉 效果 ， 同 时 也 让 读者 初步 认 知 图 像 处 理 的 基本 


步骤 与 流程 。 


Qus 如 果 没有 特别 说 明 ， 本 章 及 其 后 续 所 有 章节 默认 图 像 的 色彩 空间 都 是 RGB 空间 。 


4.1 ”失去 的 时 光 与 回忆 一- 老 照 片 特 


有 一 首 很 经 典 的 英文 歌曲 叫 《 若 日 重 来 》， 然 而 随 着 岁月 的 流逝 ， 我 们 慢 慢 知 道 了 若 日 不 会 再 来 ， 那 些微 微 泛 黄 的 照片 成 了 昔日 最 好 时 光 的 见证 。 也 许 是 为 了 满足 人 们 那 难以 割舍 的 怀旧 情结 ， 人 们 有 
时 会 想 让 图 像 看 上 去 微微 泛 黄 ， 像 是 一 张 年 代 久 远 的 者 照片 。 其 实 ， 这 可 以 通过 对 图 像 像素 值 进行 调整 来 实现 ， 英 文中 称 这 种 特效 为 Sepia Tone Effect， 在 绝 大 多 数 的 图 像 处 理应 用 软件 中 ， 它 已 经 属于 标 
配 功能 。 


它 的 实现 大 致 可 以 分 为 以 下 三 步 完 成 。 


1) 首先 对 图 像 的 每 个 像素 点 重新 计算 RGB 值 ， 代 码 如 下 。 


int fr= (int) ( ( (double) tr * 0.393) + ( (double) tg * 0.769) 

+ ( (double) tb * 0.189) ) ; 

int fg = (int) ( ( (double) tr * 0.349) + ( (double) tg * 0.686) 

+ ( (double) tb * 0.168) ) ; 

int fb- (int) ( ( (double) tr * 0.272) + ( (double) tg * 0.534) 
+ ( (double) tb * 0.131) ) ; 


2) 获取 混合 的 权重 系数 ， 通 过 随机 方法 获取 ， 取 值 范围 为 [0~1]， 代 码 如 下 。 


private double noise () { 
return Math.random () *0.5 + 0.5; 
} 


3) 根据 权重 系数 ， 将 该 像素 点 的 原 值 与 第 一 步 中 得 到 新 值 混合 ， 从 而 得 到 该 像素 最 终 值 ， 代 码 如 下 。 


private double colorBlend (double scale, double dest, double src) 
{ 
return (scale * dest + (1.0 - scale) * src); 


} 


其 中 scale 表 示 权 重 、dest 表 示 新 像素 值 、src 表 示 原 来 像素 值 。 


当然 本 例 还 涉及 其 他 两 个 编程 问题 ， 一 个 是 如 何 从 Bufferedlmage 对 象 中 读 取 像素 数据 ， 以 及 如 何 将 处 理 后 的 像素 数据 写 回 到 Bufferedlmage 对 象 中 。 为 了 让 程序 简单 易 懂 ， 这 里 通过 前 面 学 习 的 知识 
实现 了 一 个 抽象 类 AbstractBufferedlmageOp， 然 后 会 把 对 像素 数据 的 读 写 都 放 在 抽象 类 中 完成 ， 这 样 就 实现 了 代码 的 重用 ， 也 为 处 理 像 素 提 供 了 更 加 方便 的 公共 方法 。 关 于 如 何 读 取 与 写 入 像素 数据 在 前 
面 的 章节 中 已 经 详细 阐述 ， 在 此 不 再 重复 。AbstractBufferedlmageOp 类 的 实现 代码 可 以 参见 下 载 的 源 文件 。 


完全 版 实现 老 照片 效果 的 代码 如 下 : 


package com.gloomyfish.filter.study; 
import java.awt.image.BufferedImage; 
public class SepiaToneFilter extends AbstractBufferedImageOp { 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if ( dest == null ) 
dest = createCompatibleDestImage ( src, null ) ; 
int[] inPixels = new int[width*height]; 
int[] outPixels = new int[width*height] ; 
getRGB ( src, 0, 0, width, height, inPixels ) ; 
int index = 0; 
for (int row-0; row<height; rowt+) { 
int ta = 0, tr=0, tg=0, tb= 0; 
for (int col=0; col<width; col++) { 
index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 
int fr = (int) colorBlend (noise () , (tr * 0.393) (tg * 0.769) + (tb * 0.189) , tr) ; 
int fg = (int) colorBlend (noise () , (tr * 0.349) + (tg * 0.686) + (tb * 0.168) , tg) ; 
int fb = (int) colorBlend (noise () , (tr * 0.272) + (tg * 0.534) + (tb * 0.131) , tb); 
outPixels[index] = (ta << 24) | (clamp (fr) << 16) | (clamp (fg) << 8) | clamp (fb) ; 
} 
} 
SetRGB ( dest, 0, 0, width, height, outPixels ) ; 
return dest; 


private double noise () { 
return Math.random () *0.5 + 0.5; 


private double colorBlend (double scale, double dest, double src) { 
return (scale * dest + (1.0 - scale) * src); 
} 


public static int clamp (int c) 


{ 
} 


return c > 255? 255: ( (c <0) ? O: oc); 


public String toString () 
{ 


} 


return "Sepia Tone Effect - Effect from Photoshop App"; 


如 果 你 还 记得 本 书 第 3 章 的 内 容 ， 应 该 知道 只 要 在 ImagePanel 类 的 process () 方法 中 加 上 如 下 的 代码 融 可 以 得 到 上 述 滤 镜 的 运行 效果 : 


SepiaToneFilter filter = new SepiaToneFilter () ; 
destImage = filter.filter (sourceImage, null) ; 


运行 第 3 章 中 已 经 完成 的 测试 UI-MainUljava， 然 后 选择 图 像 ， 单 击 【 处 理 】 按 钮 以 后 ， 就 可 以 看 到 程序 运行 的 结果 了 。 


Ose 如 果 没 有 特别 说 明 ， 本 章 及 其 后 续 所 有 章节 默认 对 继承 自 AbstractBuffered-ImageOb 实 现 类 的 代码 中 与 使 用 的 测试 方式 都 与 本 节 中 SepiaToneFilter 的 测试 方式 完全 一 致 。 


4.2 图 像 属性 


上 一 节 只 是 提供 了 对 图 像 处 理 的 直观 感受 ， 我 们 还 需 把 图 像 属性 一 一 呈现 出 来 ， 为 后 面 更 加 深入 的 学 习 打 下 基础 ， 下 面 内 容 将 由 浅 入 深 地 介绍 图 像 的 这 些 属 性 ， 并 讲解 如 何 获取 它们 。 
1. 图 像 的 宽 与 高 
图 像 的 宽度 与 高 度 是 图 像 的 基本 属性 信息 ， 在 一 般 的 图 像 处 理 中 ， 第 一 步 都 是 获取 图 像 的 宽度 与 高 度 ，Java 语 言 通过 Bufferedlmage 对 象 可 以 很 容易 地 获取 图 像 宽度 与 高 度 。 代 码 如 下 : 


int width = image.getWidth () ; 
int height = image.getHeight () ; 


2. 图 像 的 像素 值 


像素 的 像素 值 是 图 像 中 最 重要 的 属性 之 一 ， 如 何 正确 提取 像素 值 ， 对 后 面 的 处 理 很 关键 ， 提 取 像 素 值 在 各 种 不 同 的 编程 语言 中 都 有 对 应 的 API 接 口 ， 在 Java 中 提取 图 像 像素 数据 已 经 在 前 面 做 了 非常 详细 
的 介绍 与 代码 演示 ， 在 此 不 再 玖 述 。 


3. 图 像 类 型 


图 像 文件 最 常见 的 类 型 是 JPG、GIF、PNG 格 式 ， 其 中 PNG 格 式 的 最 初 设计 目的 是 为 了 让 网 络 图 形 传输 方便 ， 该 格式 的 图 像 为 24 位 与 32 位 的 带 透 明 通 道 的 图 像 ， 只 支持 RGB 空间 。 另 外 一 种 很 常见 的 图 
像 格式 为 Windows 位 图 格式 BMP 类 型 。 无 论 是 哪 种 图 形 格式 ， 都 有 一 定 的 读 写 存储 固定 格式 ， 如 果 不 知道 如 何 读 取 一 种 图 像 类 型 ， 最 好 的 方法 是 查阅 官方 文 要 ， 对 照 格式 说明 完成 代码 即 可 实现 对 图 像 的 读 
写 。JPG 图 像 类 型 的 解码 与 编码 涉及 多 种 算法 ， 包 括 行程 编码 、 霍 夫 曼 编码 、 离 散 余弦 变换 等 ， 儿 G2000 以 后 的 版 本 还 会 用 小 波 变换 算法 作为 压缩 算法 。 其 他 的 图 像 格式 类 型 还 包括 tiff、RAW 等 。 


4. 色 彩 空间 


色彩 空间 对 图 像 的 显示 效果 与 处 理 有 很 大 的 影响 ， 有 些 图 像 处 理 手 段 只 有 在 特定 的 色彩 空间 才 会 得 到 很 好 的 效果 ， 所 以 色彩 空间 是 图 像 非常 重要 的 一 个 属性 ， 常 见 的 色彩 空间 有 RGB、HSL/HSV.、 
YCrCb 等 ， 下 面 就 分 别 介绍 这 些 色 彩 空 间 。 


RGB 色彩 空间 ， 通 过 三 种 单 色 红 (R) 、 绿 (G) 、 蓝 (B) 组 合 而 成 ， 取 值 范围 为 [0~255]， 其 色彩 空间 支持 超过 1000 万 种 的 不 同 颜色 ， 如 果 RGB (0, 0, 0) 都 为 0 则 表示 黑 
色 ，RGB (255, 255, 255) 都 为 255 表 示 白 色 。 大 多 数 图 像 默 认 的 颜色 空间 均 为 RGB 色彩 空间 。 


HSMHSV 色 彩 空 间 ， 分 别 包含 Hue 通 道 、 饱 和 度 (Saturation) 通道 、 亮 度 (Lightness) 通道 ， 常 见 的 调整 图 像 的 亮度 与 饱和 度 一 般 都 是 先 将 图 像 像素 值 从 RGB 空间 转换 到 HSsL 空 间 ， 待 调整 完毕 以 后 
再 重新 转换 回 到 RGB 色彩 空间 。 将 像素 值 从 RGB 色彩 空间 转换 到 HSL 色 彩 空间 的 代码 如 下 : 


// convert to HSL space 


min = tr; 

if (tg « min) 
min = tg; 

if (tb « min) 
min = tb; 

max = tr; 

fl = 0.0; 

f2 = tg = tb; 

if (tg > max) { 
max = tg; 
fl = 120.0; 
f2 = tb - tr; 

} 

if (tb > max) { 
max = tb; 
fl = 240.0; 
f2 =tr = tg; 

} 

dif = max - min; 


sum = max + min; 
1 = 0.5 * sum; 

if (dif == 0) { 
h = 0.0; 

s = 0.0; 


} 
else if (1 < 127.5) { 
s = 255.0 * dif / sum; 


kya 


else { 
s = 255.0 * dif / (510.0 - sum) ; 


} 
h = (f1 + 60.0 * £2 / dif) ; 
if (h< 0.0) { 

h += 360.0; 

} 


(h >= 360.0) { 
h -= 360.0; 


H: 
Ft 


像素 值 从 HSL 色 彩 空间 转换 到 RGB 色彩 空间 的 代码 如 下 : 


// conversion back to RGB space here! ! 


tr = (int) 1; 

Eg — (int) 1; 

tb = (int) 1; 
} else 


{ 
if (1 < 127.5) { 


v2 = clo255 * 1 * (255 + s8) ; 


] «Suec bo255 "5 Ws 


tr = (int) (vl + v3 * hl * c1060) ; 


} 
else if (h1 < 180.0) { 
tr = (int) v2; 


} 
else if (h1 < 240.0) { 


tr = (int) (v1 + v3 * (4 - hl * clo60) ) ; 
} 
else { 

tr = (int) vl; 


if (nl < 60.0) | 
tg = (int) (vl + v3 * hl * clo60) ; 


} 
else if (h1 < 180.0) { 
tg = (int) v2; 


} 
else if (hl < 240.0) { 
tg = (int) (vl + v3 * (4 - hl * clo60) ) ; 


} 
if (h1 < 60.0) { 
tb = (int) (vl + v3 * hl * c1060) ; 


else if (h1 < 180.0) { 
tb = (int) v2; 


else if (h1 < 240.0) { 
tb = (int) (vl + v3 * (4- hl * clo60) ) ; 


else { 
tb = (int) vl; 


YCrCb 色 彩 空间 的 三 个 通道 中 Y 的 取 值 范围 为 [16~235]，Cr 与 Cb 的 取 值 范围 均 为 [16~240]。 这 种 颜色 空间 的 设计 初衷 是 为 了 压缩 RGB 值 ， 可 以 使 用 更 少 的 空间 来 携带 相同 的 颜色 值 。 根 据 标准 不 同 ， 从 
RGB 到 YCrCb 的 转换 公式 会 稍 有 不 同 ， 最 常见 的 像素 值 RGB 色 彩 空间 变换 到 YCrCb 色 彩 空间 的 代码 如 下 : 


int y= (int) (tr * 0.299 + 
tg * 0.587 + 
tb * 0.114) ; 
int Cr = tf - yi 
int Cb = tb - y; 


43 ”图 像 的 亮度 、 对 比 度 和 饱和 度 

图 像 的 亮度 、 对 比 度 与 饱和 度 是 图 像 处 理 与 美化 中 经 常 需要 编辑 的 三 个 属性 ， 也 是 很 多 图 像 处 理 软件 的 基本 功能 之 一 ， 本 节 首 先 从 原理 上 认识 一 下 如 何 调整 这 三 个 属性 ， 在 后 续 章节 中 将 会 有 专门 的 编 
程 实践 与 应 用 实例 。 

1. 亮 度 (Brightness/lightness) 


图 像 的 亮度 从 本 质 上 来 说 是 像素 灰 度 值 的 强度 ， 取 值 在 0~255 之 间 ，0 表 示 黑 色 ，255 表 示 白 色 亮 度 值 最 大 ， 对 RGB 图 像 来 说 ，RGB (0, 0, 0) 表示 黑色 ，RGB (255, 255, 255) 表示 白色 ， 调 整 图 


像 的 亮度 就 是 对 图 像 的 像素 值 在 RGB 每 个 分 量 上 计算 平均 值 ， 然 后 用 平均 值 乘 以 亮度 系数 ， 当 系数 值 为 1 时 表示 图 像 亮度 不 变 ， 当 亮度 值 小 于 1 时 ， 图 像 将 比 原 图 暗 一 点 ， 当 亮度 值 大 于 1 时 ， 则 图 像 会 比 原 
图 亮 一 点 。 这 种 调整 亮度 的 方法 比较 直观 明了 ， 编 程 难度 也 比较 小 ， 容 易 实 现 。 另 外 一 种 更 常见 的 是 把 图 像 从 RGB 色彩 空间 转换 到 HSL 色 彩 空 间 ， 这 样 亮 度 就 对 应 [分 量 ， 可 以 直接 调整 ， 调 整 以 后 再 转换 到 
RGB 色彩 空间 即 可 。 两 种 方法 各 有 各 的 优点 与 缺点 ， 方 法 一 简单 直接 ， 计 算 量 小 ， 但 是 效果 可 能 不 是 特别 好 ， 方 法 二 精确 度 高 ， 效 果 好 。 


2. 对 比 度 (Contrast) 


从 像素 值 上 来 说 ， 提 升 图 像 对 比 度 就 是 让 像素 值 之 间 的 差异 更 加 显著 ， 从 而 更 加 突出 图 像 的 细节 与 特征 ; 降低 图 像 的 对 比 度 则 是 让 像素 值 之 间 的 差异 减 小 ， 从 而 更 多 地 隐藏 图 像 细 节 。 调 整 图 像 对 比 度 
的 算法 有 很 多 ， 最 直观 与 常见 的 算法 步 又 如 下 : 


1) 计算 图 像 像素 的 RGB 每 个 分 量 的 平均 值 。 

2) 对 每 个 待 调整 的 像素 减 去 平均 值 。 

3) 对 步骤 2 的 结果 乘 以 对 比 度 调整 系数 ，1 表 示 保 存 不 变 ， 大 于 1 表示 提高 对 比 度 ， 小 于 1 表示 减低 对 比 度 。 
4) 对 步骤 3 的 结果 加 上 RGB 分 量 的 平均 值 ， 即 为 调整 以 后 的 像素 值 。 

5) 归 一 化 处 理 ， 确 保 每 个 像素 值 落 在 0~ 255 之 间 。 

3. 饱 和 度 (Saturation) 


图 像 饱 和 度 主要 针对 色彩 空间 是 HSV/HSL 的 S$ 分量 ， 即 饱和 度 分 量 ， 对 RGB 图 像 ， 要 想 实现 对 图 像 饱 和 度 的 调整 ， 首 先 要 把 像素 值 人 RGB 色彩 空间 转换 到 HSV/HSL 色 彩 空间 ， 待 调整 完毕 以 后 再 转换 回 
到 RGB 色 彩 空 间 。 提 高 图 像 的 饱和 度 后 ， 图 像 会 非常 明亮 ; 若 降低 图 像 的 饱和 度 ， 图 像 则 看 上 去 很 暗 。 


44 图 像 饱 和 度 调整 


从 上 一 节 的 内 容 不 难看 出 ， 对 图 像 饱 和 度 的 调整 可 以 大 致 分 如 下 几 步 进行 : 


. 读 取 图 像 像素 ， 将 像素 值 从 RGB 色彩 空间 转 到 HSL 色 彩 空间 。 

- 在 HSL 色 彩 空 间 调整 S 分 量 ， 即 饱和 度 分 量 。 

. 将 第 二 步 处 理 完 的 像素 值 从 HSL 色 彩 空 间 转 换 到 RGB 色彩 空间 。 
下 面 来 看 看 编程 关键 技巧 。 
1.HSL 分 量 取 值 学 围 与 分量 值 处 理 


对 于 HsL 的 三 个 分 量 取 值 范围 ，H 的 取 值 范围 为 [0~360]， 其 余 两 个 分 量 的 取 值 范围 均 为 [0~ 255]， 在 实际 编程 中 对 于 超过 范围 的 S 分 量 值 ， 可 以 如 下 处 理 : 


s = s + sat; 
if(s«0.0) { 
s = 0.0; 


ky 


f(s > 255.0) { 
S = 255.0; 


H- 


其 中 s 表 示 饱 和 度 值 ，sat 表 示 调 整 值 ， 其 计算 公式 为 sat=127*ratio， 其 中 ratio 的 取 值 范围 为 [-1，1]， 这 样 就 最 终 得 到 处 理 以 后 的 s 值 ， 即 调整 以 后 的 饱和 度 值 。 
2.HSL 与 RGB 相 互 转化 


像素 值 在 HSL 与 RGB 色 彩 空间 相互 转换 的 代码 前 面 一 节 已 给 出 ， 可 以 直接 拿 过 来 用 ， 这 里 需要 特别 说 明 一 下 ，HSL 到 RGB 色 彩 空间 的 转换 非常 有 用 ， 很 多 图 像 处 理 算法 都 是 在 HSL/Hue 色 彩 空间 提取 特 
征 与 图 像 分 割 的 。 


3. 饱 和 度 调整 系数 ratio 
其 取 值 范围 为 [-1，1]， 这 里 给 出 了 一 个 默认 值 ， 即 为 0.25， 通 常情 况 下 ， 稍 微调 整 可 以 使 人 更 容易 接受 。 可 以 在 初始 化 调整 饱和 度 类 的 时 候 传 入 一 个 你 想 要 参数 。 


饱和 度 调整 程序 继承 了 BufferedlmageOP 接 口 ， 看 上 去 程序 更 加 通用 ， 你 几乎 不 用 做 任何 修改 就 可 以 在 应 用 程序 使 用 该 类 。 完 整 的 源 代码 如 下 : 


package com.book.chapter.four; 

import java.awt.image.BufferedImage; 

public class SaturationFilter extends AbstractBufferedImageOp { 
public final static double c1060 1.0 / 60.0; 

public final static double c10255 = 1.0 / 255.0; 
private double ratio = 0.25; 

public SaturationFilter (double ratio) { 
this.ratio = ratio; 


} 
public double getRatio () | 
return ratio; 


public void setRatio (double ratio) { 
this.ratio - ratio; 


@Override 

public BufferedImage filter (BufferedImage src, 
BufferedImage dest) { 

int width = src.getWidth () ; 

int height = src.getHeight () ; 

double sat = 127.0d * ratio; 

if ( dest == null ) 

dest = createCompatibleDestImage ( src, null ) ; 


int[] inPixels = new int[width*height] ; 

int[] outPixels = new int[width*height]; 

getRGB ( src, 0, 0, width, height, inPixels ) ; 
double min, max, dif, sum; 

double f1, £f2; 


int index - 0; 

double h, s, l; 

double vi, v2, v3, hl; 

for (int row-0; row«height; rowt+) { 

int ta = 0, tr 2-0, tg=0, tb= 0; 

for (int col=0; col«width; col++) { 
index = row * width + col; 
(inPixels[index] >> 24) & Oxf f; 
(inPixels[index] >> 16) & Oxf f; 
(inPixels[index] >> 8) & Oxff; 
inPixels[index] & Oxff; 
// convert to HSL space 

min = tr; 

if (tg « min) 

min = tg; 

if (tb < min) 

min = tb; 
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(tb > max) { 
max = tb; 
fl 
f2 
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} 
else if (1 < 127.5) { 
255.0 * dif / sun; 


n 
Il 


} 
else { 
s = 255.0 * dif / (510.0 ~ sum) ; 


} 
h= (f1 80,0 * E2 / dif); 
if (h«0.0) { 

h += 360.0; 

} 
if (h >= 360.0) { 
h -= 360.0; 


} 
// adjust saturation. 
s = s+ sat; 
if(s«0.0) { 

s = 0.0; 


} 
if(s» 255.0) { 
S = 255.0; 


} 


// conversion back to RGB space here! ! 


tr = (int) 1j 

cg = (int) 》 

Ebo dump ub 
) else { 


if (1 < 127.5) { 
v2 = clo255 * 1 * (255 + 8) 3 


v2 —oloBe-—clo255 *.s * L; 


) 

vl =2* 1 - v2; 

v3 = v2 - vl; 

hl = h + 120.0; 

if (hl >= 360.0) 
hl -= 360.0; 

if (hl < 60.0) | 


tr = (int) (vl + v3 * hl * c1060) ; 


else if (h1 < 180.0) { 
tr = (int) v2; 


else if (h1 < 240.0) { 
tr = (int) (vl + v3 * (4 - hl * clo60) ) ; 


tr = (int) vl; 


if (hl < 60.0) { 
tg = (int) (vl + v3 * hl * c1060) ; 


else if (h1 < 180.0) { 
tg = (int) v2; 


else if (h1 < 240.0) { 
tg = (int) (vl + v3 


+ 


(4 - hl * clo60) ) ; 


tg = (int) vl; 


} 

hl - h - 120.0; 
if (b1 < 0.0) { 
hl += 360.0; 


if (hl < 60.0) { 
tb = (int) (vl + v3 * hl * c1060) ; 


else if (h1 < 180.0) { 
tb = (int) v2; 


else if (h1 < 240.0) { 
tb = (int) (vl + v3 


* 


(4 - hl * clo60) ) ; 


tb = (int) vl; 


} 
outPixels[index] = (ta << 24) | (tr << 16) 
(tg << 8) | tb; 
} 


SetRGB ( dest, 0, 0, width, height, outPixels ) ; 
return dest; 


45 图像 亮 度 调整 


图 像 亮 度 调 整 在 RGB 色 彩 空 间 与 HSL 色 彩 空间 上 都 可 以 实现 ， 而 且 都 比较 直观 易 懂 。 首 先 来 看 一 下 在 RGB 色 彩 空间 进行 图 像 亮 度 调 整 的 方法 步 


1) 计算 像素 在 R、G、B 三 个 分 量 上 的 平均 值 (means) 。 

2) 在 第 一 步 基础 上 对 三 个 平均 值 分 别 乘 以 对 应 的 亮度 系数 brightness， 默 认 值 为 1 表示 亮度 不 变 ， 大 于 1 表示 亮度 提高 ， 小 于 表示 亮度 降低 。 
3) 对 每 个 像素 值 在 R、G、B 上 的 分 量 ， 首 先 减 去 第 一 步 计 算出 来 的 平均 值 ， 然 后 再 加 上 第 二 步 的 计算 结果 。 

总 结 上 述 三 步 ， 调 整 图 像 亮 度 的 公式 可 以 简单 归纳 为 : 

Pnew=Pold+ (brightness—1) *means 

其 中 Pnew 表 示 处 理 以 后 的 像素 ，Pold 表 示 处 理 以 前 的 像素 ，brightness 表 示 亮 度 系数 ， 取 值 范围 为 [0~ 3]，means 表 示 图 像 像素 的 平均 值 。 


很 多 图 像 处 理 软件 中 的 亮度 调整 都 是 基于 HSLHue 色 彩 空 间 完成 的 ， 因 为 在 HSL 色 彩 空间 中 [分 量 即 表示 亮度 分 量 ， 调 整 很 直观 、 容 易 理 解 ， 


和 度 的 步骤 极其 相似 ， 唯 一 不 同 的 是 对 [分 量 所 进行 的 计算 ， 其 他 保持 不 变 ， 这 里 就 不 再 蓝 述 。 


下 面 来 看 看 编程 天 键 技巧 。 


UR: 


通过 改变 HSL 中 的 L 


Aa 
JJ 里 > 


现 亮 度 调整 的 大 致 步骤 与 调整 饱 


计算 图 像 像素 平均 值 需要 将 变量 定义 为 double 类 型 ， 图 像 总 的 像素 数 为 图 像 的 宽度 乘 以 图 像 的 高 度 。 人 在 实现 该 类 时 ， 同 样 继承 了 AbstractBufferedlmageOp 的 抽象 类 ， 这 样 就 可 以 重用 像素 数组 读 写 


完整 的 代码 如 下 : 


package com.book.chapter.four; 

import java.awt.image.BufferedImage; 

public class BrightFilter extends AbstractBufferedImageOp { 
private float brightness; 

public BrightFilter () { 

this (1.2f) ; 


ublic BrightFilter (float bright) { 
this.brightness - bright; 


Ow 


} 
public float getBrightness () { 
return brightness; 


public void setBrightness (float brightness) (| 
this.brightness - brightness; 


@Override 

public BufferedImage filter (BufferedImage src, 
BufferedImage dest) { 

int width = src.getWidth () ; 

int height = src.getHeight () ; 

if (dest == null) 


的 代码 了 。 处 理 以 后 的 像素 值 可 能 小 于 0 或 大 于 255， 所 以 对 超出 0~255 这 个 范围 的 像素 值 ， 如 果 小 于 0 则 赋值 为 0， 大 于 255 则 赋值 为 225， 这 样 就 可 保证 所 有 的 像素 值 都 落 在 RGB 的 取 值 范围 之 内 。 


dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 
src.getRGB (0, 0, width, height, inPixels, 0, width) ; 
// calculate RED, GREEN, BLUE means of pixel 
int index = 0; 
int [] rgbmeans = new int[3]; 
double redSum = 0, greenSum = 0, blueSum = 0; 
double total = height * width; 
for (int row = 0; row < height; rowt+) { 
int ta = 0, tr=0, tg=0, tb= 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 
redSum += tr; 
greenSum += tg; 
blueSum += tb; 
} 
// get means 
rgbmeans[0] = (int)  (redSum / total) ; 
rgbmeans[1] = (int)  (greenSum / total) ; 
rgbmeans[2] = (int)  (blueSum / total) ; 
// adjust brightness algorithm, here 
for (int row = 0; row < height; rowt+) { 
int ta = 0, tr=0, tg=0, tb= 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 
// remove means 
tr -= rgbmeans[0]; 
tg -= rgbmeans[1]; 
tb -= rgbmeans [2]; 
// adjust brightness 


tr += (int) (rgbmeans[0] * getBrightness () ) ; 
tg += (int) (rgbmeans[1] * getBrightness () ) ; 
tb += (int) (rgbmeans[2] * getBrightness () ) ; 
outPixels[index] = (ta << 24) | (clamp (tr) << 16) 
| (clamp (tg) << 8) | clamp (tb) ; 
} 
} 
SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 
} 
public int clamp (int value) { 
return value > 255 ? 255 : 
(value < 0? 0: value) ; 


测试 该 功能 只 需 


46 图 像 对 比 度 调整 


在 具体 讲述 图 像 对 比 度 调 整 之 前 ， 首 先 介 
比 图 将 显示 出 更 多 的 图 像 细节 差异 ， 低 的 对 比 度 将 会 


受 上 一 节 内 容 的 启发 ， 对 图 像 像素 值 求 取 平 均值 以 后 
节 在 计算 像素 平均 值 时 ， 很 多 时 候 会 由 于 图 像 分 


i 绍 一 下 图 像 对 比 度 的 概念 及 
缩小 图 像 像素 值 在 颜色 与 亮度 上 的 差异 


} 辩 率 很 高 、 像 素数 据 较 多 


要 调用 第 3 章 提 到 的 ImagePanel 类 的 process 方 法 即 可 。 


1) 读 取 每 个 RGB 像素 值 Prgb，Crgb = Prgb/255， 使 其 值 范围 为 [0~1]。 


2) 基于 第 一 步 计算 结果 ( (Crgb - 0.5) *contrast + 0.5) *255, 


3) 第 二 步 中 得 到 的 结果 就 是 处 理 以 后 的 像素 值 。 


Qum 在 第 三 步 中 必须 检查 处 理 以 后 的 结果 ， 如 果 值 大 于 255， 则 255 为 处 理 后 的 像素 值 ， 如 果 小 于 0， 则 0 为 处 理 后 的 像素 值 。Conttast 为 对 比 度 系 数 ， 


其 中 Prgb 表 示 处 理 之 前 的 像素 值 ，Crgb 为 第 一 步 计 算 以 后 的 中 间 结 果 


实现 图 像 对 比 度 调整 的 代码 如 下 : 


package com.book.chapter. 
import java.awt 
public class Con 
private 
public Con 


t.image. 


four; 


FferedI 


mage; 


trastFilter extends AbstractBuf 


float con 


this (0.0f) ; 


trastFilter 


trast; 


0 


public ContrastFilter (float c) 


{ 
} 


pub] 


this.contrast = 


> 


ic 


} 


return con 


float getContrast () { 
trast; 


lic void setCon 


this.contrast = contrast; 


@Override 


public 


FeredI 


filter (BufferedI 


But 


fered] 


[mageOp { 


trast (float contrast) | 


mage src, 


int wid 


FeredI 


mage dest) 


int height - 


th = src.getWidth () ; 


src.getHeight () ; 


if (dest == null) 


dest 
int[] 


— crea 


teCompatibleDestI 
inPixels = new int[width * height]; 


{ 


Image (src, null) ; 


int[] outPixels = new int[width * height]; 


src.getRGB ( 


contrast = 


} 


cont 


} 


contrast = 


0, 


rast = 


0, 


width, 


height, 
// handle user input parameter-contrast 


inPixels, 0, width) ; 


if (this.contrast » 100) 
{ 

100; 

if (this.contrast < -100) 
{ 


-100; 


(1 + contrast / 100.0f) ; 


意义 。 所 谓 图 像 对 比 度 ， 就 是 对 图 像 颜 色 与 亮度 差异 感 


， 各 个 像素 减 去 平均 值得 到 的 就 是 各 像素 之 间 的 差 值 ， 将 这 
造成 计算 过 度 ， 所 以 更 简洁 地 调整 图 像 对 比 度 的 大 致 方法 如 下 (前 提 为 对 比 度 系 数 用 户 输入 范围 是 [-100~100]) : 


知 ， 对 比 度 越 大 ， 图 像 的 对 象 与 周围 差异 性 也 就 越 大 ， 反 之 亦 然 。 高 的 对 


。 从 上 面 的 解释 不 难得 出 ， 要 调整 图 像 对 比 度 ， 还 是 在 于 如 何 调整 图 像 的 各 个 像素 值 而 不 改变 图 像 原 有 的 信息 。 


文 些 差 值 乘 以 一 定 的 对 比 度 系 数 ， 然 后 再 加 上 平均 值 即 可 得 到 调整 以 后 的 像素 值 。 但 是 上 


其 取 值 范围 为 [0~2]。 


// adjust image contrast pixel by pixel, here 

int index = 0; 

for (int row = 0; row < height; rowt+) { 
int ta = 0, tr = 0, tg=0, tb= 0; 

for (int col = 0; col < width; col++) { 

index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 


t inPixels[index] & Oxff; 
// make it more difference 

float cr = ( (tr /255.0f) - 0.5f) * contrast; 
float cg = ( (tg /255.0f) - 0.5f) * contrast; 
float cb = ( (tb /255.0f) - 0.5f) * contrast; 
// output RGB value 


tr = (int) ( (cr + 0.5f) * 255.0f) ; 
tg = (int) ( (eg t 0.5f» * 255.0£) ; 
tb = (int) ( (cb 0.5f) * 255.0f) ; 


// write it back 
outPixels[index] = (ta << 24) | (clamp (tr) << 16) 
| (clamp (tg) «« 8) | clamp (tb) ; 


SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 


public int clamp (int value) { 
return value > 255 ? 255 : 
(value < 0? 0: value) ; 


同样 ， 测 试 该 功能 只 需要 调用 第 3 章 提 到 的 ImagePanel 类 的 process 方 法 即 可 。 


47 ”综合 应 用 一 一 调整 图 像 之 度 、 对 比 度 和 饱和 度 


上 面 几 节 着 重 介绍 了 如 何 调整 图 像 亮度 、 对 比 度 、 饱 和 度 ， 接 触 了 日 常 图 像 处 理 中 最 重要 的 几 个 属性 调整 方法 。 从 上 面 的 介绍 也 不 难 发 现 ， 调 整 图 像 亮度 、 对 比 度 的 方法 有 很 多 ， 不 能 简单 以 好 坏 评 
价 ， 调 整 图 像 饱 和 度 的 方法 其 实 也 不 少 ， 但 是 基本 都 是 基于 Hue 色 彩 空间 完成 的 。 本 节 将 上 面 几 节 所 学 知识 融合 到 一 起 ， 实 现 一 个 可 以 运行 的 、 调 整 图 像 亮度 、 对 比 度 、 饱 和 度 的 Swing 应 用 程序 。 首 先 介 
绍 实现 思路 ， 在 这 里 用 一 个 类 来 实现 这 三 个 功能 ， 所 以 首先 要 做 到 的 就 是 对 输入 参数 的 支持 与 处 理 。 其 次 ， 在 Ul 编 程 方面 ， 要 支持 用 户 数据 输入 ， 这 里 使 用 了 三 个 Jslider 滑 块 组 件 来 对 应 亮度 、 对 比 度 、 饱 
和 度 的 调整 参数 ， 调 整 完成 以 后 单 击 【确定 】 即 可 生效 。 


1.UI 编 程 实现 思路 


第 3 章 中 介绍 了 一 个 测试 图 像 处 理 的 Swing 程序 ， 这 里 只 要 对 此 程序 稍 加 修改 ， 就 可 以 实现 亮度 、 对 比 度 和 饱和 度 这 三 个 参数 的 用 户 输入 。 做 法 很 简单 ， 只 要 在 单 击 【处 理 】 按 钮 的 响应 事件 中 弹出 一 个 
对 话 框 ， 其 中 包含 三 个 Jslider 组 件 GER) ， 分 别 对 应 亮度 、 对 比 度 、 饱 和 度 三 个 属性 调节 的 值 学 围 ， 抑 动 滑 块 调整 三 个 值 ， 然 后 单 击 【 确 定 】 按 钮 即 可 得 到 效果 。 


对 话 框 实现 的 代码 如 下 : 


package com.book.chapter.four; 
import java.awt.BorderLayout; 
import java.awt.Dimension; 
import java.awt.FlowLayout; 
import java.awt.GridLayout; 
import java.awt.Toolkit; 
import java.awt.Window; 
import java.awt.event.ActionListener; 
import javax.swing.JButton; 
import javax.swing.JDialog; 
import javax.swing.JFrame; 
import javax.swing.JLabel; 
import javax.swing.JPanel; 
import javax.swing.JSlider; 
public class BrightContrastSatUI extends JDialog { 
/** 
* 
*/ 


private static final long serialVersionUID = 1L; 
private JButton okBtn; 


private JLabel bLabel; 
private JLabel cLabel; 
private JLabel sLabel; 


private JSlider bSlider; 
private JSlider cSlider; 
private JSlider sSlider; 
public BrightContrastSatUI (JFrame parent) 
{ 


super (parent, "调整 图 像 亮 度 、 对 比 度 、 饱 和 度 ") ; 
initComponent () ; 


) 


private void initComponent () { 


okBtn = new JButton ("确定 ") ; 
bLabel = new JLabel ("亮度 ") ; 
cLabel = new JLabel ("对 比 度 ") ; 
sLabel = new JLabel ("af Š") ; 


bSlider = new JSlider (JSlider.HORIZONTAL, -100, 100, 0); 
bSlider.setMajorTickSpacing (40) ; 
bSlider.setMinorTickSpacing (10) ; 

bSlider.setPaintLabels (true) ; 

bSlider.setPaintTicks (true) ; 

bSlider.setPaintTrack (true) ; 

cSlider = new JSlider (JSlider.HORIZONTAL, -100, 100, 0); 
cSlider.setMajorTickSpacing (40) ; 
cSlider.setMinorTickSpacing (10) ; 

cSlider.setPaintLabels (true) ; 

cSlider.setPaintTicks (true) ; 

cSlider.setPaintTrack (true) ; 

sSlider = new JSlider (JSlider.HORIZONTAL, -100, 100, 0); 
sSlider.setMajorTickSpacing (40) ; 
sSlider.setMinorTickSpacing (10) ; 

sSlider.setPaintLabels (true) ; 

sSlider.setPaintTicks (true) ; 

sSlider.setPaintTrack (true) ; 

this.getContentPane () .setLayout (new BorderLayout () ) ; 
JPanel bPanel - new JPanel () ; 

bPanel.setLayout (new FlowLayout (FlowLayout.CENTER) ) ; 
bPanel.add (bLabel) ; 

bPanel.add (bSlider) ; 

JPanel cPanel - new JPanel () ; 

cPanel.setLayout (new FlowLayout (FlowLayout.CENTER) ) ; 
cPanel.add (cLabel) ; 

cPanel.add (cSlider) ; 

JPanel sPanel - new JPanel () ; 

sPanel.setLayout (new FlowLayout (FlowLayout.CENTER) ) ; 
sPanel.add (sLabel) ; 

sPanel.add (sSlider) ; 

JPanel contentPanel - new JPanel () ; 

contentPanel.setLayout (new GridLayout (3, 1) ) ; 
contentPanel.add (bPanel 
contentPanel.add (cPanel 
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contentPanel.add (sPanel) ; 

JPanel btnPanel = new JPanel () ; 

btnPanel.setLayout (new FlowLayout (FlowLayout.RIGHT) ) ; 
btnPanel.add (okBtn) ; 
this.getContentPane () .add (contentPanel, BorderLayout.CENTER) ; 
this.getContentPane () .add (btnPanel, BorderLayout.SOUTH) ; 
this.pack () ; 


} 
public static void centre (Window w) { 

Dimension us = w.getSize () ; 

Dimension them = Toolkit.getDefaultToolkit () .getScreenSize () ; 
int newX = (them.width - us.width) / 2; 

int newY = (them.height - us.height) / 2; 

w.setLocation (newX, newY) ; 


} 
public int getBright () 
{ 


} 
public int getContrast () 


{ 


} 
public int getSaturation () 


{ 


} 
public void showUI () 


{ 


return bSlider.getValue () ; 


return cSlider.getValue () ; 


return sSlider.getValue () ; 


centre (this) ; 
this.setVisible (true) ; 


} 


public void setupActionListener (ActionListener 1) 


{ 
} 


this.okBtn.addActionListener (1) ; 


2. 亮 度 、 对 比 度 、 饱 和 度 调整 编程 思路 


调整 饱和 度 与 亮度 有 一 定 的 直接 联系 ， 饱 和 度 越 高 颜色 越 亮 ， 否 则 越 暗 淡 ， 而 亮度 越 高 则 图 像 越 发 日 ， 亮 度 越 低 则 图 像 越发 黑 ， 对 比 度 越 明显 则 图 像 细 节 越 突 出 ， 反 之 则 细节 不 是 很 明显 。 知 道 这 些 知 
识 以 后 ， 相 信 你 已 清楚 不 要 同时 调整 图 像 的 亮度 与 饱和 度 两 个 属性 了 。 而 图 像 对 比 度 调整 相对 比较 独立 ， 可 以 与 调整 图 像 的 亮度 或 者 饱和 度 同 时 进行 。 在 编程 实现 中 ， 为 了 代码 重用 ， 首 先 把 像素 值 在 HSL 
与 RGB 色彩 空间 互 换 ， 放 到 抽象 类 Abstract-BufferedImageOp 中 ， 做 成 两 个 公共 方法 ， 这 样 让 所 有 继承 类 都 可 以 使 用 ， 其 次 把 检查 RGB 值 范围 的 方法 也 放 到 抽象 类 AbstractBufferedlmageOp 中 ， 让 所 有 
的 子 类 /继承 类 都 可 以 使 用 。 完 成 以 后 的 调整 饱和 度 、 亮 度 、 对 比 度 的 完整 源 代码 如 下 : 


package com.book.chapter.four; 

import java.awt.image.BufferedImage; 

public class BCSAdjustFilter extends AbstractBufferedImageOp { 
private double contrast; 
private double brightness; 
private double saturation; 

public double getContrast () { 

return contrast; 


ublic void setContrast (double contrast) { 
this.contrast - contrast; 
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} 
public double getBrightness () { 
return brightness; 


} 
public void setBrightness (double brightness) { 
this.brightness - brightness; 


} 
public double getSaturation () { 
return saturation; 


public void setSaturation (double saturation) { 
this.saturation - saturation; 


@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
handleParameters () ; 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if ( dest == null ) 


dest = createCompatibleDestImage ( src, null ) ; 
int[] inPixels = new int[width*height] ; 
int[] outPixels = new int[width*height] ; 


getRGB ( src, 0, 0, width, height, inPixels ) ; 
int index = 0; 
for (int row-0; row«height; rowt+) { 

int ta- 0, tr 2-0, tg=0, tbh=0; 
for (int col=0; col«width; col++) { 
index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 


double[] hsl = rgb2Hsl (new int[]{tr, tg, tb}) ; 
// adjust saturation. 
hsl[1] = hsl[1] * saturation; 


if ( hsl[1] < 0.0 { 
hsl[1] = 0.0; 

} 

if ( hsl[1] > 255.0) { 
hsl[1] = 255.0; 


// adjust brightness 
hsl[2] = hsl[2] * brightness; 
if ( hsl[2] < 0.0 { 

hsl[2] = 0.0; 


} 
if ( hsl[2] > 255.0) { 
hsl[2] = 255.0; 


} 

// back to RGB space 

int[] rgb = hsl2RGB (hsl) ; 
tr = clamp (rgb[0]) ; 

tg = clamp (rgb[1]) ; 
tb = clamp (rgb[2]) ; 
// adjust contrast 
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double cr = ( (tr /255.0d) - 0.5d) * contrast; 
double cg = ( (tg /255.0d) - 0.5d) * contrast; 
double cb = ( (tb /255.0d) - 0.5d) * contrast; 
// output RGB value 

tr = (int) ( (cr + 0.5f) * 255.0f) ; 

tg = (int) ( (eg + 0.5f) * 255.0f) ; 

tb = (int) ( (cb 0.5f) * 255.0f) ; 


// write it back 
outPixels[index] = (ta << 24) 
(clamp (tr) << 16) 
| (clamp (tg) << 8) | 
clamp (tb) ; 
} 


RGB ( dest, 0, 0, width, height, outPixels ) ; 
urn dest; 
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rei 


} 
private void handleParameters () { 
contrast = (1.0 + contrast/100.0) ; 
brightness = (1.0 + brightness/100.0) ; 


saturation = (1.0 + saturation/100.0) ; 


} 


3.35 BEES] 
在 UI 上 看 到 三 个 参数 的 取 值 范围 均 为 [-100，100]， 其 中 0 表示 不 改变 原 值 ， 小 于 0 表示 亮度 /对 比 度 / 饱 和 度 值 相 比 于 调整 之 前 降低 ， 反 之 则 提高 。 
4. 测 试 


只 需要 在 原来 第 3 章 的 actionperformed () 方法 中 加 上 如 下 的 代码 片段 即 可 完成 测试 。 


final BrightContrastSatUI bcsUI = new 
BrightContrastSatUI (this) ; 
bcsUI.setupActionListener (new ActionListener () { 
@Override 
public void actionPerformed (ActionEvent e) { 
bcsUI.setVisible (false) ; 
bcsUI.dispose () ; 
double s = bcsUI.getSaturation () ; 
double b = bcsUI.getBright () ; 
double c = bcsUI.getContrast () ; 
imagePanel.process (new double[]{s, b, c}) ; 
imagePanel.repaint () ; 


a 
bcsUI.showUI () ; 


完整 源 代码 请 参考 下 载 的 源 文 件 。 本 节 其 余 的 源 代码 也 请 参照 相关 源 文 件 ， 源 代码 也 是 本 书 的 一 部 分 ， 强 烈 建 议 详细 阅读 。 在 这 里 也 说 明 一 下 ， 笔 者 喜欢 用 英文 注释 ， 注 释 所 用 的 英文 都 很 简单 ， 大 家 
都 应 该 可 以 看 得 明白 。 
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本 章 详 细 介绍 了 图 像 的 一 些 基 本 属性 及 其 获取 方法 、 图 像 常见 色彩 空间 ， 以 及 相互 间 转 换 方 法 。 此 外 ， 还 介绍 了 亮度 、 对 比 度 、 饱 和 度 的 概念 ， 以 及 调整 它们 的 方法 ， 此 外 还 介绍 了 一 些 编程 技巧 。 需 
要 特别 说 明 的 是 调整 图 像 亮度 、 对 比 度 、 饱 和 度 的 方法 有 很 多 ， 这 里 介绍 的 方法 只 是 其 中 之 一 ， 感 兴趣 的 读者 自己 可 以 进一步 编程 实践 ， 尝 试 更 多 属于 自己 的 方式 ， 为 程序 打上 自己 的 印记 。 这 也 是 笔者 一 
直 推 崇 的 学 习 方 法 ， 只 有 不 断 地 编程 实践 才能 更 好 地 促进 对 理论 知识 的 理解 与 灵活 应 用 。 


第 5 草 ”像素 基本 操作 


第 4 章 介绍 了 图 像 的 常见 属性 ， 特 别 介绍 了 其 中 经 常 需 要 调整 的 三 个 基本 属性 ， 即 图 像 的 亮度 、 对 比 度 、 饱 和 度 。 通 过 学 习 如 何 调整 这 三 个 属性 ， 相 信 读 者 对 图 像 处 理 中 的 像素 操作 有 了 最 基本 的 认 知 ， 
明白 了 图 像 像素 是 图 像 组 成 中 最 基本 也 是 最 重要 的 数据 单元 ， 本 章 将 继续 学 习 关 于 图 像 像素 的 基本 操作 ， 并 且 通 过 一 些 非常 实用 的 图 像 颜色 特效 来 演示 像素 基本 操作 在 图 像 处 理 中 的 巧妙 运用 。 


首先 基于 自然 色彩 滤 镜 应 用 实践 来 剖析 像素 基本 操作 一 一 加 减 乘 除 对 一 幅 图 像 的 影响 ， 然 后 通过 两 幅 图 像 之 间 的 像素 操作 来 介绍 透明 通道 混合 (alpha-blending) 的 常用 方法 ， 最 后 通过 实现 图 像 立 体 
水 印 文字 来 说 明 像 素 基 本 操作 在 现实 世界 的 运用 。 所 有 这 些 知 识 都 是 立足 于 解决 实际 问题 来 前 述 的 ， 真 正 做 到 学 以 致 用 ， 注 重 编程 与 实践 、 科 学 与 趣味 性 并 重 。 


51 大 目 然 的 色彩 一 一 目 然 系列 渡 镜 


在 很 多 移动 或 在 线 的 图 像 处 理 App 中 ， 常 会 看 到 将 一 张 照 片 变换 为 一 系列 色彩 不 同 的 照片 ， 给 这 些 色彩 不 同 的 照片 取 的 名 字 也 是 五 花 八 门 ， 什 么 都 有 。 本 节 通 过 一 些 简 单 像素 操作 ， 得 到 不 同色 彩 的 图 


像 。 笔 者 给 这 一 系列 功能 也 取 了 名 字 ， 叫 自然 系列 滤 镜 。 好 吧 ， 言 归 正 传 ， 让 我 们 来 看 看 如 何 实现 这 一 系列 色彩 不 同 滤 镜 的 编程 。 
本 节 实 现 的 自然 系列 滤 镜 有 以 下 9 种 ， 都 是 对 像素 做 加 减 乘 除 简单 运算 以 后 获得 的 。 
空气 风格 
对 图 像 的 每 个 像素 值 在 R、G、B 三 个 分 量 上 分 别 两 两 相 加 ， 然 后 取 平 均值 作为 新 像素 值 ， 实 现代 码 如 下 (tr、tg、tb 表 示 输 入 RGB 像素 值 三 个 分 量 ，Ppixel 表 示 处 理 后 的 像素 值 ) : 
pixel[1] = (tg + tb) / 2j 
pixel[2] = (tr + tb) / 2; 
pixel[3] = (tg + tr) / 2; 


CEU 


实现 更 为 简单 ， 对 RGB 像素 值 三 个 分 量 进 行 简单 的 求 取 平 均值 后 再 处 理 即 可 ， 实 现代 码 如 下 : 


int gray = (tr + tg + tb) / 3; 


pixel[1] = clamp (gray * 3) ; 
pixel[2] = gray; 
pixel[3] = gray / 3; 

. RUE 


通过 建立 颜色 查找 表 实 现 ， 目 的 是 减少 计算 量 ， 同 时 这 也 是 很 多 图 像 色 彩 调整 的 技巧 之 一 ， 在 本 节 的 后 面 将 会 详细 介绍 ， 雾 风格 的 代码 如 下 (fogLookUp 为 颜色 查找 表 ) : 


pixel[1] = fogLookUp[tr]; 
pixel[2] = fogLookUp [tg]; 
pixel[3] = fogLookUp[tb]; 


冰冻 风格 


属于 冷色 调 的 调 色 ， 所 以 饱和 度 与 亮度 应 该 相对 降低 ， 其 代码 如 下 : 


all 


= clamp ( (int) Math.abs ( (tr - tg - tb) * 1.5) ) ; 
pixel[2] = clamp ( (int) Math.abs ( (tg - tb - pixel[1]) * 1.5) ) ; 
= clamp ( (int) Math.abs ( (tb - pixel[1] - pixel[2]) * 1.5) ) ; 


int gray = (tr + tg + tb) / 3; 

pixel[1] = gray; 

pixel [2] = Math.abs (tb - 128) ; 

pixel [3] = Math.abs (tb - 128) ; 
E63 


现 ， 处 理 方法 类 似 ， 代 码 如 下 : 


B 


金属 风格 色彩 比较 单一 ， 但 是 轮廓 分 明 ， 有 点 灰暗 的 感觉 ， 通 过 获取 RGB 分 量 中 R 分 量 来 取 值 处 理 实现 ， 当 然 也 可 以 通过 其 他 分 量 来 


loat r = Math.abs (tr - 64) ; 


float g = Math.abs (r - 64) ; 

float b = Math.abs (g - 64) ; 

Float gray = ( (222 * r + 707 * g + 71 * b) / 1000) ; 
r = gray + 70; 
r=r+ (( (x - 128) * 100) / 100£) ; 
g = gray + 65; 
g=g+ (04g - 128) * 100) /100f) 3 
b = gray 75; 
b=b+ (((b- 128) * 100 / 100£) ; 
pixel[l] = clamp ( (int) x) ; 
pixel[2] = clamp ( (int) g) ; 
pixel[3] = clamp ( (int) b) ; 

. 海洋 风格 


大 海 总 是 奉 蓝 色 的 ， 所 以 海洋 风格 就 是 把 像素 值 RGB 的 三 个 分 量 相 加 取得 平均 数 ， 然 后 将 最 大 的 比重 放 到 蓝 色 分 量 中 ， 代 码 如 下 : 


int gray = (tr + tg + tb) / 3; 
Vpixel[1] = clamp (gray / 3) ; 
pixel[2] = gray; 

pixel[3] = clamp (gray * 3) ; 


:湖水 风格 


湖水 的 颜色 总 是 略微 带 有 神秘 色彩 的 意味 ， 代 码 实 现 如 下 : 


int gray = (tr + tg + tb) / 3; 

pixel[1] = clamp (gray - tg - tb) ; 

pixel[2] = clamp (gray - pixel[1] - tb) ; 

pixel[3] = clamp (gray — pixel[1] = pixel[2]) ; 
-彩虹 风格 


通过 颜色 查找 表 实 现 ， 根 据 一 张 彩虹 图 片 初始 化 生成 彩虹 颜色 查找 表 。 关 于 如 何 生成 查找 表 稍 后 会 详细 介绍 ， 以 下 代码 主要 演示 使 用 查找 表 来 实现 彩虹 风格 。 


pixel[1] = rainbowLookUp[tr]; 
pixel[2] = rainbowLookUp[tg]; 
pixel[3] = rainbowLookUp [tb]; 


通过 上 述 代 码 详细 演绎 像素 之 间 加 减 乘除 的 巧妙 运用 ， 实 现 了 各 种 不 同 颜色 风格 的 图 像 调整 ， 上 述 实现 中 还 涉及 另外 一 个 重要 的 图 像 处 理 技巧 一 建立 图 像 颜色 查找 表 ， 在 彩虹 风格 与 雾 风 格 中 ， 分 别 
通过 两 种 不 同 的 初始 化 查找 表 方 法 建立 了 图 像 查找 表 ， 在 风格 处 理 中 ， 只 要 将 图 像 像素 作为 索引 值 获取 查找 表 中 的 值 即 为 新 的 像素 值 ， 大 致 来 说 图 像 查找 表 建 立 可 以 基于 以 下 两 种 方式 。 


第 一 种 方式 是 基于 规则 或 特定 算法 生成 颜色 查找 表 ， 雾 风格 的 颜色 查找 表 的 建立 就 是 基于 这 种 方式 的 ， 代 码 如 下 : 


private void buildFogLookupTable () { 
fogLookUp = new int[256]; 

int fogLimit = 40; 

for (int i-0; i<fogLookUp.length; i++) 
{ 


if (i > 127) 
{ 
fogLookUp[i] = i - fogLimit; 
if (fogLookUp[i] < 127) 
{ 
fogLookUp[i] = 127; 
} 
} 
else 
{ 
fogLookUp [i] + fogLimit; 


= d 
f (fogLookUp[i] > 127) 
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fogLookUp[i] = 127; 


第 二 种 方式 是 基于 特定 图 像 给 出 的 颜色 作为 标准 来 生成 颜色 查找 表 ， 彩 虹 风 格 就 基于 这 种 方式 ， 代 码 如 下 : 


private void buildRainBowLookupTable () 


rainbowLookUp = new int[256]; 
java.net.URL imageURL = this.getClass () . 
getResource ("rainbow.png") ; 


BufferedImage image = ImageIO.read (imageURL) ; 
width = image.getWidth () ; 

height = image.getHeight () ; 

[] inPixels = new int[width * height]; 

RGB (image, 0, 0, width, height, inPixels) ; 


ct ct ct ct 


for (int col = 0; col < width; col++) { 
rainbowLookUp[col] = inPixels[col]; 
} 


} catch (IOException e) { 
System.err.println ("An error occured " + 
"when loading the image iconhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/OEBPS/Text/...") ; 


} 


这 里 只 是 简单 地 列举 一 下 图 像 处 理 中 颜色 查找 表 的 建立 方法 ， 在 细节 上 还 有 很 多 可 以 改进 的 地 方 ， 这 些 内 容 将 在 后 面 的 章节 中 不 断 深入 ， 这 里 只 是 先 引 入 概念 ， 达 到 “ 授 人 以 鱼 不 如 授 人 以 渔 ” 的 效 
果 。 本 节 的 全 部 源 代码 可 以 参见 源 文件 ， 源 代码 也 是 本 书 的 一 部 分 ， 请 读者 一 定 仔细 阅读 ， 动 手 实践 。 


细心 的 读者 可 能 也 注意 到 了 ， 本 节 对 图 像 的 处 理 只 涉及 了 一 些 最 基本 的 数学 运算 ， 下 一 节 将 详细 剖析 图 像 像素 加 减 乘除 运算 的 实际 意义 。 


5.2 ”图 像 像素 加 减 乘 除 


通过 上 一 节 的 学 习 ， 大 家 对 图 像 像 素 的 基本 运算 有 了 一 定 的 了 解 ， 这 里 通过 实例 更 加 深入 地 学 习 图 像 像 素 加 减 乘 除 的 实际 效果 。 


[ai 


1. 像 素 加 操作 
对 于 像素 加 操作 ， 首 先 想到 的 是 对 每 个 像素 加 上 特定 值 ， 如 果 用 公式 表示 ， 则 为 : 
P'=P+N 


其 中 P 表 示 处 理 以 后 的 像素 值 ，P 表 示 原 像素 值 ，N 表 示 噪 声 ， 直 和 白 一 点 讲 也 可 以 是 一 个 值 或 一 个 数学 表达 式 。 这 里 通过 一 个 随机 数 函 数 来 生成 一 些 随机 值 加 到 每 个 像素 值 上 ， 从 而 达到 图 像 加 噪 效果 。 
像素 加 操作 的 代码 实现 如 下 : 


private int addNoise (int p) 


boolean valid = false; 
do { 
int ran = (int) Math.round ( 


rnd.nextGaussian () *range) ; 
int v =p + ran; // pixel add noise 
valid = v>=0 && v<=255; 

if (valid p^v; 

} while (! valid) ; 

return p; 


} 


2. 像 素 减 操作 
从 本 质 上 来 阅 ， 像 素 减 操作 也 是 图 像 像素 加 操作 ， 这 里 以 当前 像素 点 像素 值 与 前 一 个 像素 点 像素 值 相 减 得 到 的 值 重新 赋值 作为 当前 像素 点 像素 值 ， 大 致 的 数学 表达 可 以 为 : 
P1'=P1— P0 


其 中 P1 表 示 当 前 像素 ，P0 表 示 当 前 像素 在 X 轴 方向 的 左 侧 相 邻 像素 ，P1 表 示 新 像素 值 。 如 图 5-1 所 示 。 


rl =F1-— PU 


图 5-1 像素 减 操作 


该 像素 操作 的 代码 实现 如 下 : 


private int[] minus (int[] rgb, int p) { 
int tr = (p»» 16) & Oxff; 
int tg = (p >> 8) & Oxff; 
int tb =p & Oxff; 
clamp (rgb[0] 


rgb[0] = 0] epe) d 
rgo[1] = clamp (rgb[1] - tg) ; 
rgb[2] = clamp (rgb[2] - tb) ; 


return rgb; 


} 


Quse 两 个 像素 值 相 减 ， 得 到 的 可 能 是 负数 ， 所 以 clamp 方 法 用 来 处 理 越界 像素 值 ，RGB 像 素 的 各 个 分 量 取 值 均 为 0~255。 
3. 像 素 乘 操作 


这 里 也 通过 一 个 实际 图 像 处 理 效果 
边缘 。 这 里 有 以 下 两 个 重要 的 计算 步骤 。 


聚光灯 效果 来 演示 像素 的 乘法 操作 。 顾 名 思 义 ， 聚 光 灯 效果 就 是 将 一 束 光 打 到 一 张 图 像 的 正中 心 ， 从 中 心 开 始 到 边缘 ， 随 着 距离 变化 ， 亮 度 不 断 变 暗 ， 直 至 图 像 


1) 计算 从 中 心 到 边缘 变换 时 每 个 像素 要 乘 的 系数 ， 中 心 点 的 系数 为 1， 边 缘 的 系数 为 0， 随 着 梯度 的 变化 ， 系 数值 由 像素 坐标 点 P_(X，y) 到 中 心 点 C (x, y) 的 距离 决定 。 首 先 要 计算 中 心 点 到 边缘 的 
最 大 距离 值 ， 即 P 作 为 P (0，0) 到 中 心 点 C (x, y) 的 距离 ， 其 中 x 与 y 分 别 为 图 像 宽度 与 高 度 的 一 半 ， 根 据 两 点 之 间 欧 几 里 得 几何 距离 公式 : 


一 -一 一 一 一 一 -一 一 一 一 一 一 一 -一 一 


Distance = y (X2 —-ALl) x (X2 - Al) + (¥2 - YI) x (Y2 - Yl) 


可 以 首先 得 到 最 大 距离 Dmax， 然 后 根据 任意 像素 点 P 与 中 心 点 的 距离 D， 计 算出 系数 factor: 


fo 


fa 


2) 根据 第 一 步 


, 


p 


计算 出 来 的 系数 求 得 新 的 像素 值 ， 即 为 : 


m (D ID - 


P =PX factor 
大 致 的 代码 实现 如 下 : 
private int[] multiple (int[] rgb, double maxDistance, 
int cx, int cy, int row, int col) { 
double scale = 1.0 - 
getDistance (cx, cy, col, row) /maxDistance; 


scale = scale * scale; 


rgb[0] = (int) (scale * rgb[0]) ; 
rgb[1] = (int) (scale * rgb[1]) ; 
rgb[2] = (int) (scale * rgb[2]) ; 
return rgb; 


从 运行 效果 可 以 看 出 ， 


4. 像 素 除 操作 


图 像 从 中 心 开 始 到 边缘 随 距离 变化 ， 图 像 慢 慢 变 暗 。 


像素 除 操作 本 质 上 就 是 像素 乘 操 作 ， 这 里 就 不 再 歼 述 举例 。 


本 节 提 到 内 容 的 完整 源 代 码 如 下 : 


package com.book.chapter. five; 
import java.awt.image.BufferedImage; 


import java.util.Random; 
import 


com.book.chapter.four.AbstractBuf 


feredImageOp; 


/** 


* plus/minus/multiplication/division 


FferedlImageOp { 


* Qauthor fish 
* 
*/ 
public class PMMDFilter extends AbstractBu 
public final static int PLUS = 1; 
public final static int MINUS = 2; 
public final static int MULTIPLE = 


private Random rnd; 
private double range; 
private int type; 
public PMMDFilter () 
{ 


type = MULTIPLE; 
rnd = new Random () ; 
range = 25.0; 


} 


@Override 


filter (BufferedImage src, 


public BufferedImage 
BufferedImage dest 
int width = src.getWidth () ; 

int height = src.getHeight () ; 
if (dest == null) 


) 1 


dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 
getRGB (src, 0, 0, width, height, inPixels) ; 


int index = 0; 
int centerX = width/2; 
int centerY = height/2; 


double maxDistance = Math.sqrt (centerX * centerX + 
centerY * centerY) ; 
for (int row = 0; row < height; rowt+) { 
int ta = 0, tr 2-0, tg=0, tbh=0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 
int[] rgb = new int[]{tr, tg, tb); 


// plus 
if (type == PLUS) 
{ 


rgb = plus (rgb) ; 


} 
// minus 
if (type == MINUS) 
{ 
int pcol = col - 1 


pcol = 0; 


b 


if (pcol < 0 || pcol >= width) 
{ 


int index2 = row * width + pcol; 


rgb = minus (rgb, 


P 


if (type == MULTIPLE) 


rgb = multiple (rgb, 


centerX, 
} 
tr = rgb[0]; 
tg = rgb[1]; 
tb = rgb[2]; 
outPixels[index] = (t 
} 
} 
SetRGB (dest, 0, 0, width, 
return dest; 
} 
private int[] multiple (int[] rgb, 
int cx, int cy, int row, 


inPixels[index2]) ; 


maxDistance, 


centerY, row, col) ; 


a << 24) | (tr << 16) 


height, outPixels) ; 


double maxDistance, 
int col) { 


double scale = 1.0 - 
getDistance (cx, cy, 
scale = scale * scale; 


row) /maxDistance; 


int p) ( 


rgb[0] = (int) (scale * rgb[0]) ; 
rgb[1] = (int) (scale * rgb[1]) ; 
rgb[2] = (int) (scale * rgb[2]) ; 
return rgb; 

} 

private int[] minus (int[] rgb, 
int tr = (p >> 16) & Oxff; 
int tg = (p >> 8) & Oxff; 
int tb =p & Oxff; 


rgb [0] = clamp (rgb[0] - tr) ; 


(tg << 8) 


tb; 


rgb[1] = clamp (rgb[1] 
rgb[2] = clamp (rgb[2] 
return rgb; 

} 

private int[] plus (int[] rgb) 

{ 


] = addNoise (rgb[0]) ; 
rgb[1] = addNoise (rgb[1]) ; 
] = addNoise (rgb[2]) ; 
return rgb; 
} 
private int addNoise (int p) 
{ 
boolean valid = false; 
do { 
int ran = (int) Math.round ( 
rnd.nextGaussian () *range) ; 
int v = p + ran; // pixel add noise 
valid = v»-0 && v<=255; 
if (valid p^v; 
} while (! valid) ; 
return p; 


} 
private double getDistance (int cx, int cy, 
int px, int py) 
double xx = (cx - px) * (cx - px) ; 
double yy = (cy - py) * (cy - py) ; 
return (int) Math.sqrt (xx + yy) ; 


测试 该 程序 ， 同 样 只 要 在 第 3 章 的 ImagePanel 类 的 process 方 法 中 完成 如 下 代码 : 


public void process () 

{ 
PMMDFilter filter = new PMMDFilter () ; 
destImage = filter.filter (sourceImage, null) ; 


然后 运行 MainUljava 方 法 ， 选 择 图 片 ， 单 击 【 处 理 】 按 钮 即 可 。 


5.3 AEE SSI 

本 节 通 过 讲述 两 幅 图 像 的 透明 通道 融合 与 二 加 实践 来 演示 两 幅 图 像 像素 之 间 的 加 减 乘 除 ， 然 后 就 可 以 得 到 一 幅 融 合 了 两 幅 图 像 内 容 的 新 图 片 。 下 面 会 仔细 训 析 几 种 典型 图 像 二 加 方法 ， 继 续 演示 图 像 像 
素 的 基本 操作 。 在 开始 之 前 ， 为 了 简便 计算 ， 首 先 假设 两 幅 图 像 的 大 小 完全 一 致 ， 对 应 的 像素 数组 分 别 为 A 与 B， 对 应 的 任意 单个 像素 值 分 别 为 a 与 b， 混 合 以 后 的 像素 值 为 c。 

REA dm 

RASMA ARMAC= (axb) /255， 对 于 RGB 像素 值 ， 代 码 实现 如 下 : 


private int modeOne (int vl, int v2) { 
return (vl * v2) / 255; 


} 


加 法 县 加 


加 法 芍 加 的 公式 可 以 表示 为 c= (a+b) /2， 对 于 RGB 像 素 值 ， 代 码 实 现 如 下 : 


private int modeTwo (int vl, int v2) { 
return (vl + v2) / 2; 


} 
DO EI 
减法 三 加 的 公式 可 以 表示 为 c= |a - b|, MAMEMNNAE, MoaxxUvAnBETEOASSNRSPUREE, SMS USBSKEIRHRXENM AEST IS. fCRBSCHURD T: 


private int modeThree (int vl, int v2) { 
return Math.abs (vl - v2) ; 


} 
: RR eI 


IMSS INAIZsUR Lem = 255- ( (255-a) x (255-b) /255) ， 首 先 对 各 自 的 像素 值 取 反 ， 然 后 使 用 乘法 于 加 之 后 对 得 到 的 结果 再 次 取 反 ， 这 里 说 的 像素 值 取 反 是 指 对 任意 原 像素 值 p 来 说 ， 
它 的 取 反 结果 为 255 - p。 取 反 便 加 的 代码 实现 如 下 : 


private int modeFour (double vl, double v2) { 
double p= (int) ( (255 = v1) * (255- v2) ) ; 
return (int) (255 - (p/255)); 


“ 加 法 取 反 县 加 


加 法 取 反 苹 加 的 公式 可 以 表示 为 c=255 - (a+b) { (a+b) <255}|c=0{ (a+b) >=255}， 该 表达 式 表示 如 果 a + b 的 和 小 于 255， 则 取 前 面部 分 作为 计算 结果 ， 否 则 c = 0。 代 码 实 现 如 下 : 


private int modeFive (double vl, double v2) { 
int p = (int) (v1 + v2) ; 

if (p > 255) 

return 0; 


else 


return 255 - pj 


- RERA Siu 


RARR At zmAC= (a/ (255-b) ) x255， 其 中 b 不 能 等 于 255 (读者 可 以 自己 想 一 下 其 原因 ) ， 在 b = 255 时 ， 令 c= 255。 代 码 实 现 如 下 : 


private int modeSix (double vl, double v2) { 
if (v2 — 255) 

return 0; 
double p= (v1 / (255 - v2) ) * 255; 
return clamp ( (int) p) ; 


上 面 6 种 图 像 混 合 方式 的 完整 代码 如 下 : 


package com.book.chapter. five; 
import java.awt.image.Bu 
import com.book.chapter.four.AbstractBufferedImageOp; 

ublic class BlendFilter extends AbstractBufferedImageOp { 
ublic final static int MULTIPLY P 


ublic final static int PLUS PIX 25 
ublic final static int MINUS PIXEL = 3; 
ublic final static int INVERSE PIXEL - 4; 
lic final static int INVERSE P] EL = 5; 


ublic final static int DIVISION PIXEL 


rivate BufferedImage secondImage; 
ublic BlendFilter () { 
MODE = MULTIPLY PIXEL; 
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lic void setBlendMode (int mode) { 
this.MODE = mode; 


public void setSecondImage (BufferedImage image) { 
this.secondImage = image; 


} 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
checkImages (src) ; 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 


dest = createCompatibleDestImage (src, null) ; 
int[] inputl = new int[width * height]; 
int[] input2 = new int[secondImage.getWidth () * secondImage.getHeight () ]; 
int[] outPixels = new int[width * height]; 


getRGB (src, 0, 0, width, height, inputl) ; 

tRGB (secondImage, 0, 0, secondImage.getWidth () , 
secondImage.getHeight () , input2) ; 
int index - 0; 
int tal = 0, trl = 0, tgl = 0, tbl = 0; 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
tal = (inputl[index] >> 24) & Oxff; 
trl = (inputl[index] >> 16) & Oxff; 
tgl = (inputl [index] >> 8 & Oxff; 
tbl = inputl [index] & Oxff; 
int[] rgb = getBlendData (trl, tgl, tbl, input2, row, col) ; 
outPixels[index] = (tal << 24) (rgb[0] << 16) | (rgb[1] << 8) 

| rgb[2]; 


} 


setRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 


private int[] getBlendData (int trl, int tgl, int tbl, int[] input, int row, 
int col) { 
int width = secondImage.getWidth () ; 
int height = secondImage.getHeight () ; 
if (col >= width || row >= height) { 
return new int[] { trl, tgl, tbl }; 


int index = row * width + col; 

int tr = (input[index] >> 16) & Oxff; 

int tg = (input[index] >> 8) & Oxff; 

int tb = input[index] & Oxff; 

int[] rgb = new int[3]; 

if (MODE == MULT PLY P XEL) | 
rgb[0] = modeOne (trl, tr) ; 
rgb[1] = modeOne (tgl, tg) ; 
rgb[2] = modeOne (tbl, tb) ; 

} else if (MODE == PLUS PIXEL) { 
rgb[0] = modeTwo (trl, tr) ; 
rgb[1] = modeTwo (tgl, tg) ; 
rgb[2] = modeTwo (tbl, tb) ; 

} else if (MODE == MINUS PIXEL) { 
rgb[0] = modeThree (trl, tr) ; 
rgb[1] = modeThree (tgl, tg) ; 
rgb[2] = modeThree (tbl, tb) ; 

} else if (MODE == INVERSE PIXEL) { 
rgb[0] = modeFour (trl, tr) ; 
rgb[1] = modeFour (tgl, tg) ; 
rgb[2] = modeFour (tbl, tb) ; 

) else if (MODE == INVERSE PLUS PIXEL) { 
rgb[0] = modeFive (trl, tr) ; 
rgb[1] = modeFive (tgl, tg) ; 
rgb[2] = modeFive (tbl, tb) ; 

} else if (MODE == VISION PIXEL) { 
rgb[0] = modeSix (trl, tr); 
rgb[1] = modeSix (tgl, tg) ; 
rgb[2] = modeSix (tbl, tb) ; 


return rgb; 


private int modeOne (int vl, int v2) { 


return (vl * v2) / 255; 


Ols 


private int modeTwo (int vl, int v2) { 
return (vl + v2) / 2; 


private int modeThree (int vl, int v2) { 
return Math.abs (vl - v2) ; 
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private int modeFour (double vl, double v2) { 
double p= (int) ( (255 - v1) * (255 - v2) ) ; 
return (int) (255 - (p / 255) ) ; 


private int modeFive (double vl, double v2) { 
int p = (int) (vl + v2) ; 

if (p 255) 

return 0; 


return 255 - pj 


private int modeSix (double vl, double v2) { 
if (v2 == 255) 

return 0; 
double p= (vi/ (255 - v2) ) * 255; 
return clamp ( (int) p) ; 


an 


private void checkImages (BufferedImage src) { 
j width = src.getWidth () ; 
height = src.getHeight () ; 
if (secondImage == null 
|| secondImage.getWidth () > width 
|| secondImage.getHeight () > height) { 
throw new IllegalArgumentException ( 
"the width, height of the input image must be " + 
"great than blend image") ; 


运行 测试 该 实例 程序 ， 同 样 只 使 用 第 3 章 中 提 到 的 ImagePanel 类 process 方 法 ， 调 用 该 实现 类 即 可 实现 。 


基于 像素 操作 的 图 像 混合 与 芭 加 算法 有 很 多 ， 几 乎 主流 的 图 像 处 理 软件 中 都 提供 两 幅 图 像 芭 加 与 混合 的 功能 ， 混 合 硬 加 方法 也 非常 多 ， 感 兴趣 的 读者 可 以 自己 做 更 加 深入 的 研究 。 上 面 演示 的 6 种 方法 主 
要 是 从 实例 角度 说明 一 些 带 见 算术 运算 在 图 像 处 理 过程 的 运用 ， 帮 助 读 者 慢 慢 建 立 简单 的 数学 概念 。 从 本 章 开 始 将 介绍 一 些 基 本 的 数学 知识 ， 从 本 质 上 来 说 ， 图 像 处理 是 建立 在 数学 模型 的 基础 上 的 ， 实 际 
编程 应 用 都 可 以 从 数学 模型 中 找到 痕迹 。 和 希望 读者 在 编程 实践 的 同时 ， 也 适当 学 习 一 些 基 本 数学 知识 的 运用 技巧 。 


5.4 一 个 更 加 深入 的 应 用 实践 一 一 图 像 上 轧 花 文字 效果 


本 节 通 过 一 个 具有 实际 意义 的 文字 与 图 像 融合 实例 来 更 加 深入 与 系统 地 学 习 图 像 处 理 中 对 像素 操作 的 高 级 技巧 。 对 于 任意 一 张 彩色 图 像 ， 准 备 好 一 张 黑白 单 色 文字 图 像 ， 通 过 一 系列 的 像素 操作 最 终 形 
成 彩色 图 像 上 的 轧 花 文字 ， 从 而 实现 特殊 的 文字 水 印 特效 图 像 。 这 在 实际 项 目 中 非常 有 意义 ， 很 多 大 型 的 互联 网 站 点 都 是 通过 显示 文字 水 印 来 防止 图 像 资源 被 盗用 的 。 本 节 的 学 习 可 帮助 读者 打开 这 方面 的 
思路 ， 提 高 在 工作 中 解决 实际 图 像 处 理 问题 的 能 力 。 


1. 基 本 思路 


主要 利用 文字 图 像 像素 在 X 和 Y 方 向 上 同时 移 位 一 个 像素 ， 完 成 对 二 值 图 像 提取 文字 骨架 的 操作 ， 宽 度 为 一 个 像素 ， 然 后 将 提取 的 骨架 按照 一 定 的 像素 值 与 目标 图 像 的 像素 值 融合 晋 加 即 可 。 人 在 这 里 为 了 
处 理 上 的 简洁 ， 假 设 文字 图 像 为 黑白 二 值 图 像 ， 并 设 定 取 到 的 骨架 像素 为 黑色 ， 然 后 检查 文字 图 像 中 的 黑色 像素 ， 根 据 像素 位 置 得 到 相对 目标 图 像 的 像素 ， 两 个 像素 进行 直接 设置 ， 最 后 在 目标 图 像 上 得 到 
一 个 富有 立体 感 的 文字 水 印 。 


2. 程 序 实 现 步骤 
1) 读 入 准备 好 的 黑白 文字 图 片 ， 创 建 两 张大 小 一 致 的 单 色白 板 图 像 (Bufferedlmage) 。 


Top-left 位 移 一 个 像素 ， 将 每 个 对 应 的 像素 值 copy 到 单 色 白板 图 像 中 ， 如 图 5-2 所 示 ， 其 中 ， 虚 线 内 的 像素 将 向 上 向 左 移动 一 个 像素 。 


图 5-2 ”虚线 待 移动 像素 


2) 与 第 1 步 类 似 ， 只 是 向 下 向 右 移动 一 个 像素 ， 将 每 个 对 应 的 像素 值 copy 到 另外 单 色白 板 图 像 中 。 


3) 分 别 将 第 2、3 两 步 中 得 到 的 图 片 与 原来 的 图 像 进行 逻辑 “或 ”操作 ， 得 到 左上 与 右 下 的 文字 骨架 。 


4) 将 两 个 文字 骨 


3. 编 程 关 键 点 : 


主要 是 利用 像素 移 位 操作 实现 一 个 像素 宽 的 整体 图 像 位 置 移动 ， 向 哪个 方向 移动 通过 


int width = s 
int height - 
if (dest == null) 


像素 位 移 处 理 


rc.getWidth () ; 
src.getHeight () ; 


架 像 素 填充 到 目标 采 


8 多 色 图 像 中 ， 即 可 得 到 立体 轧 花 效果 水 印 文字 。 


dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 
getRGB (src, 0, 0, width, height, inPixels) ; 
int index - 0; 
int index2 = 0; 
// initialization outPixels 
for (int row = 0; row < height; rowt-) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
outPixels[index] = (255 << 24) | (255 << 16) 
| (255 << 8) | 255; 
} 
} 
// one pixel transfer 
for (int row = 1; row < height; rowt+) { 
int ta = 0, tr=0, tg=0, tb= 0; 
for (int col = 1; col < width; col++) { 
index = row * width + col; 
index2 = (row - 1) * width + (col - 1) ; 
ta = (inPixels[isTop ? index : index2] >> 24) & 
tr = (inPixels[isTop ? index : index2] >> 16) & 
tg = (inPixels[isTop ? index : index2] >> 8) & 
tb = inPixels[isTop ? index : index2] & Oxff 
outPixels[isTop ? index2 : index] = (ta << 24) 
| (tr << 16) 
| (tg << 8) | tb; 
} 
} 
SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 
4. 编 程 关 键 点 : 文字 骨架 获取 


Oxf 
Oxf 


Oxf 


ME 


过 boolean 变 量 isTop 来 实现 控制 ， 这 是 


实现 像素 移 位 的 关键 之 处 ， 相 关 代 码 如 下 : 


因为 这 里 的 文字 图 片 是 白色 背景 和 黑色 文字 ， 所 以 骨架 提取 时 ， 像 素 值 接近 0， 这 就 是 我 们 感 兴趣 的 文字 内 容 ， 而 对 于 白色 背景 直接 填充 即 可 。 相 关 代 码 如 下 : 


// now get on 


e pixel data 


int index = 0; 


for (int row = 0; row < height; rowt+) { 
int ta = 0, tr = 0, tg=0, tb= 0; 
int ta2 = 0, tr2 = 0, tg2 = 0, tb2 = 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels [index] >> 8) & Oxff; 
tb = inPixels[index] & Oxf 
ta2 = (outPixels[index] >> '24) & Oxff; 
tr2 = (outPixels[index] »» 16) & Oxff; 
tg2 = (outPixels[index] >> 9) & Oxff; 
tb2 = outPixels[index] & Oxff 
if (tr2 == tr && tg == tg2 && tb == tb2) { 
outPixels[index] = (255 << 24) (255 << 16) 
| (255 << 8) 
| 2555 
} else { 
if (tr2 < 5 && tg2 < 5 && th2 < 5) { 
outPixels[index] = (ta2 << 24) 
| (tr2 << 16) 
| (tg2 << 8) | tb2; 
} else { 
outPixels[index] = (255 << 24) 
| (255 << 16) 
| (255 << 8) | 255; 
} 
} 
} 
SetRGB (destImage, 0, 0, width, height, outPixels) ; 
5. 编 程 关键 点 : 像素 逻辑 或 操作 


通过 实现 对 像素 点 像素 值 的 扫描 ， 找 到 像素 值 趋 近 0 的 文字 内 容 像 素 点 ， 


dw) ; 


int width = src.getWidth () ; 
int height = src.getHeight () ; 
int dw = dest.getWidth () ; 
int dh = dest.getHeight () ; 
int[] sinPixels = new int[width * height]; 
int[] dinPixels = new int[dw * dh]; 
src.getRGB (0, 0, width, height, sinPixels, 0, 
dest.getRGB (0, 0, dw, dh, dinPixels, 0, 
int index = 0; 
int index2 = 0; 
for (int y=0; y < height; y++) { 
for (int x = 0; x < width; x++) { 
index = y * width + x; 
int srgb = sinPixels [index]; 
int rl = (srgb >> 16) & Oxff; 
int gl = (srgb >> 8) & Oxff; 
int bl = srgb & Oxf 
if (rl > 200 || gi S= 200 || bl >= 200) { 
continue; 
} 
index2 = y * dw + x; 
if (colorInverse) { 
rl = 255 = ris 
gl = 255 - gl; 
bl = 255 = bl; 
} 
dinPixels[index2] = (255 << 24) 
| Exl se T6) | ‘(gl 96 82 I B1; 
} 
} 
dest.setRGB (0, 0, dw, dh, dinPixels, 0, 


Os XTGUPAAEGS 当 对 图 像 进 行 像素 处 理 时 ， 由 于 很 多 图 像 软 件 在 生产 黑白 文字 图 片 时 会 自动 实现 反 锯齿 功能 ， 所 以 边缘 像素 不 会 是 0 或 255 这 样 的 值 ， 而 有 一 


dw) ; 


width) ; 


0~255 之 间 ， 所 以 上 面 的 代码 中 ， 当 大 于 200 时 就 可 以 认为 是 白色 背景 像素 ， 


完整 的 水 印 实现 程序 如 下 : 


即 可 得 到 想 要 的 轧 花 结果 。 相 关 代码 如 下 : 


小 于 5 就 可 以 认为 是 黑色 像素 ， 这 样 就 避免 了 对 文字 图 像 进 


行 二 值 化 处 理 ， 


减少 了 一 些 处 理 步骤 。 


些 边缘 模糊 ， 且 其 像素 值 在 


package com. 


book.chapter.five; 


import java.awt.image.BufferedImage; 
import com.book.chapter.four.AbstractBufferedlImageOp; 
public class BitBltFilter extends AbstractBufferedImageOp { 
// raster operation - bit block transfer. 
// 1975 for the Smalltalk-72 system, For the Smalltalk-74 system 
private boolean isTop = true; 
/** 
* left — top skeleton or right - bottom. 


* 


* (param isTop 


a] 


public void setTop (boolean isTop) 


this.isTop = isTop; 


} 
/** 


* blend the pixels and get the 
* 


* (param 
* (param 


a 


public void emboss (BufferedImage text 
j ter = new Biti 


textImage 
targetImage 
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// emboss now 
embossImage (topImage, 


embossImage (buttomImage, 
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QOverride 
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FferedlImage 


filter (Buffered] 
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targetImage, 
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public 


in 
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(dest null) 
dest = crea 
inPixels 


int 
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[] 
getRGB (src, 


outPixels 
0, 
index 0; 

index2 = 0; 


0, 


th = src.getWid 
t height = src.getHeight () ; 


teCompa 
new int[width * height]; 
t[width * height]; 
inPixels) ; 


new in 
width, 


h () 


2 


ibleDestImage (src, 


height, 


// initialization outPixels 


for 
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(int row = 0; 
for (int col 
index 


0; 


} 


// one pixel transfer 


for 


setRGB (dest, 
turn dest; 


* 
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+ + + + Xo Xo FW 
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(int row 
int ta = 0, 
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index 
index2 = 
ta 
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row * wid 
(row - 
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row++) 
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row * width + col; 
outPixels [index] 


(255 << 24) 


row++) 
tg = 0, tb = 0; 

col < width; 

th + col; 


1) 


index : 
index : 


(inPixe] 


} 


0, 0, 


width 
height 
inPixels 
outPixels 
destImage 
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(inPixels[isTop ? 
inPixels[isTop ? 
outPixels[isTop ? 
| (tg << 8) | 


width, 


index : 
index : 

index2 : 
to? 


index 


height, 


private void processonePixelWidth (int width, 


int 
for 


SetRGB (destImage, 


int[] outPixels, 


index = 0; 
(int row = 0; 
int ta = 0, 


row < heigh 
tr = 0, 


int ta2 = 0, 
for (int col = 0; 


(inPixel 
(inPixe] 


ta 


tr2 = 0, 


t; rowt-) 
tg = 0, tbh = 0; 

tg2 = 0, 
col < width; 


index = row * width + col; 
S 
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[index] »» 24) 
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u 
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outPixels [index] 
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dex] >> 8 
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Image, 
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inPixels) ; 


outPixels) ; 
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height, 
inPixels, 
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col++) 
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col++) 


* width + (col - 1) ; 
j index2] 
index2] 
index2] 
index2] 


] 


int height, 
BufferedImage destImage) 
// now get one pixel data 


{ 


S, outPixels, Image) ; 
outPixels) ; 


^ 
outPixels, 


top 


true) ; 
false) ; 


BufferedImage dest) { 


null) ; 


{ 


(255 << 16) | (255 << 8) | 
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>> 24) 
>> 16) 
>> 8) 
& Oxff; 
(ta «« 24) 


& Oxf 
& Oxf 
Oxf 
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(tr «« 16) 


outPixels) ; 
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tb2 = 0; 
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24) & Oxff; 
& Oxff; 
& Oxff; 


(tr2 == tr && tg == tg2 && tb == 


outPixels[index] (255 «« 24) 
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tb2) { 
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{ 
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) | (255 «« 1 


outPixels) ; 


} 
/** 
* 
* (param src 
* (param dest 
* (param colorInverse 
* - must be setted here! ! ! 
* 
/ 
private void embossImage (BufferedImage src, BufferedImage dest, 
boolean colorInverse) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
int dw = dest.getWidth () ; 
int dh = dest.getHeight R 
int[] sinPixels = new int[width * height]; 
int[] dinPixels = new int[dw * dh]; 
src.getRGB (0, 0, width, height, sinPixels, 0, width) ; 
dest.getRGB (0, 0, dw, dh, dinPixels, 0, dw) ; 
int index = 0; 
int index2 = 0; 
for (int y=0; y < height; y++) { 
for (int x = 0; x < width; x++) { 
index = y * width + x; 
int srgb = sinPixels [index]; 
int rl = (srgb >> 16) & Oxff; 


buttomImage) ; 


255; 


int gl = (srgb >> 8) & Oxff; 

int bl = srgb & Oxf 

if (rl > 200 || gl >= 200 || bl >= 200) { 
continue; 


} 


index2 = y * dw + x; 


if (colorInverse) | 
rl = 255 - ri; 
gl = 255 - gl; 
o bie 
} 
dinPixels[index2] = (255 << 24) | (rl << 16) | (gl << 8) | bl; 


} 
} 
dest.setRGB (0, 0, dw, dh, dinPixels, 0, dw) ; 


运行 与 测试 该 程序 : 


调用 此 文字 水 印 类 ， 传 入 文字 图 片 与 目标 图 像 以 后 ， 执 行 如 下 两 行 代 码 即 可 得 到 最 终 的 效果 图 像 。 


BitBltFilter filter = new BitBltFilter () ; 
filter.emboss (textImg, targetImg) ; 


关于 测试 代码 完整 的 源 程序 清单 ， 参 见 源 文件 中 的 索引 BitBItFilterTestjava。 
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本 章 由浅 入 深 地 介绍 了 图 像 处 理 中 像素 算术 运算 方法 与 应 用 技巧 ， 以 及 其 使 用 实例 ， 对 于 图 像 像素 的 逻辑 操作 (与 、 或 、 非 ) ， 并 没有 详细 介绍 ， 感 兴趣 的 读者 可 以 自己 进一步 学 习 。 


第 6 章 ”像素 统计 与 应 用 


第 5 章 学 习 了 像素 算术 运算 的 各 种 方法 与 技巧 ， 一 张 图 像 最 重要 的 特征 就 是 各 个 像素 值 ， 对 它 进行 数学 建 模 与 变换 可 以 得 到 各 种 不 同 的 特征 ， 如 图 像 像素 平均 值 、 最 大 值 与 最 小 值 、 像 素 个 数 、 像 素 值 的 
分 布 等 统计 信息 可 以 很 直观 地 反映 出 一 张 图 像 的 基本 特征 ， 本 章 将 会 一 一 介绍 如 何 获取 这 些 统计 值 ， 以 及 如 何 将 这 些 统计 值 应 用 到 实际 项 目 中 。 为 了 更 好 地 突出 统计 这 些 值 的 方法 ， 在 计算 统计 值 时 使 用 的 
图 像 都 是 灰 度 图 像 ， 彩 色 图 像 处 理 只 要 人 在 RGB 三 个 通道 上 分 别 做 与 灰 度 一 样 的 计算 即 可 。 本 章 将 通过 统计 像素 值 出 现 频 率 得 到 图 像 直方 图 ， 以 几 个 实例 说 明 图 像 直方 图 在 图 像 二 值 化 、 图 像 均衡 化 调整 、 图 


像 匹 配 等 方面 的 实际 应 用 ， 为 读者 进一步 打开 思路 ， 掌 握 图 像 直方 图 这 一 重要 的 统计 特征 。 


同样 ， 在 本 章 中 也 会 介绍 一 些 相关 数学 知识 ， 这 些 数学 知识 的 学 习 与 理解 对 掌握 本 章 内 容 至 天 重要 ， 请 读者 认真 对 待 。 再 次 强调 ， 源 代码 也 是 本 书 的 一 部 分 ， 请 务必 理解 ， 积 极 实践 。 


6.1 ”统计 图 像 的 均值 、 最 大 值 与 最 小 值 


在 实际 图 像 处 理 中 图 像 像素 的 均值 、 最 大 值 与 最 小 值 是 第 一 步 要 计算 处 理 的 属性 数据 ， 本 节 通 过 介绍 如 何 计算 图 像 像素 的 均值 、 最 大 值 、 最 小 值 、 方 差 及 其 使 用 技巧 ， 帮 助 读者 学 习 掌握 这 一 基本 知识 
与 应 用 。 


首先 来 看 一 下 计算 图 像 均值 、 方 差 的 数学 表达 : 


mean = sum( P aub LA x Y) 


/(X x Y) 


var = stdev x stdev 


其 中 mean 表 示 图 像 像素 的 算术 平均 值 ，stdev 表 示 标 准 方差 ， 标 准 方差 越 小 说 明 像素 之 间 的 差异 越 小 ， 图 像 像素 值 与 它 的 算术 平均 值 越 接近 。 上 面 公式 中 Sum (Py, y) 表示 图 像 所 有 像素 之 和 ，X 与 Y 分 别 


(mean X mean ) 


sidev = ,/Sum( P, 


表示 图 像 像 素 宽 度 与 高 度 。 
1. 计 算 图 像 像 素 的 均值 、 最 大 值 、 最 小 值 


首先 通过 下 面 的 程序 学 习 如 何 计算 图 像 像素 的 算术 平均 值 、 最 大 值 与 最 小 值 。 代 码 如 下 : 


// calculate mean， MAX， MIN 


for (int row = = 08 row < height; rowt+) { 
int tr = 0; 

for (int col = 0; col < width; col--) { 
index = = row * width + col; 

tr = (inPixels[index] >> 16) & Oxff; 
min = Math.min (min, tr) ; 

max = Math.max (max, tr) ; 

sum += tr; 


} 
} 
double mean = sum / (width * height) ; 


2. 计 算 图 像 像素 的 标准 方差 


对 于 计算 图 像 像素 的 标准 方差 ， 这 里 使 用 的 方法 与 常见 的 方差 公式 稍 有 不 同 ， 但 是 计算 更 加 简洁 、 方 便 且 实用 ， 代 码 如 下 : 


// calculate standard deviation 
double stdev - 0.0; 
double total = width * height; 
sum = 0.0; 
for (int row = 0; row < height; rowt-) { 
int tr = 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
tr = (inPixels[index] >> 16) & Oxff; 
sum += tr * tr; 
outPixels[index] = (255 << 24) 
| (tr << 16) | (tr << 8) | tr; 


} 


stdev = (sum / total) - Math.pow (mean, 2) ; 


3. 使 用 标准 方差 实现 空白 图 像 过 滤 


在 很 多 图 像 处 理 的 应 用 场景 中 ， 由 于 各 种 原因 ， 照 相机 拍摄 的 图 像 很 多 是 没有 信息 与 内 容 的 空白 图 片 ， 不 一 定 是 黑色 或 和 白色， 这些 空 白 图 片 可 能 更 接近 灰 度 [0~255] 之 间 某 个 值 ， 根 据 这 些 特 点 ， 我 们 可 
以 在 预 处 理 时 先 计算 图 像 的 方差 ， 然 后 将 其 与 给 定 的 某 个 闪 值 进行 比较 ， 如 果 小 于 该 国 值 ， 则 可 以 认为 是 空白 图 像 。 这 样 做 正 是 利用 图 像 方差 越 小 ， 则 像素 之 间 差 异 越 小 的 数学 原理 ， 实 现 了 对 空白 图 像 的 
过 滤 与 查找 。 完 整 的 代码 实现 如 下 : 


package com.book.chapter.six; 
import java.awt.image.BufferedImage; 
import com.book.chapter.four.AbstractBufferedImageOp; 
public class PixelStatisticFilter extends AbstractBufferedImageOp { 
private double threshold; 
private boolean blankImage; 
public PixelStatisticFilter () { 
blankImage = false; 
threshold = 1.0; 


} 
public boolean isBlankImage () { 
return blankImage; 


} 
public double getThreshold () { 
return threshold; 


public void setThreshold (double threshold) { 
this.threshold = threshold; 


@Override 
public BufferedImage filter (BufferedImage src, 
BufferedImage dest) { 

int width = src.getWidth () ; 


int height = src.getHeight () ; 
blankImage = false; 
if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 


getRGB (src, 0, 0, width, height, inPixels) ; 
int index - 0; 

// calculate mean, MAX, MIN 

int max = 0; 

int min = 255; 

double sum = 0.0; 

for (int row = 0; row < height; rowt+) { 

int tr = 0; 


for (int col = 0; col < width; col++) { 
index = row * width + col; 
tr = (inPixels[index] >> 16) & Oxff; 
min = Math.min (min, tr) ; 
max = Math.max (max, tr) ; 
sum += tr; 


} 

} 

double mean = sum / (width * height) ; 

// calculate standard deviation 

double stdev = 0.0; 

double total = width * height; 

sum = 0.0; 

for (int row = 0; row < height; rowt+) { 
int tr = 0; 

for (int col = 0; col < width; col++) { 

index = row * width + col; 


tr = (inPixels[index] >> 16) & Oxff; 
sum += tr * tr; 
outPixels[index] = (255 << 24) 

| (tr << 16) 


| (tr << 8) | tr; 


} 

stdev = (sum / total) - Math.pow (mean, 2) ; 
if (stdev <= threshold) 
{ 


blankImage = true; 


System.out.println ("均值 = " + mean 

+" 标准 方差 =" + stdev) ; 
SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 


测试 该 程序 同样 只 要 在 第 3 章 的 ImagePanel 的 process 方 法 内 添加 如 下 代码 即 可 : 


PixelStatisticFilter filter new PixelStatisticFilter () ; 
destImage = filter.filter (sourceImage, null) ; 
System.out.println ("Image Blank is " + filter.isBlankImage () ) ; 


然后 在 Eclipse 中 运行 MainUl.java， 选 择 一 张 灰 度 图 像 进行 测试 ， 即 可 在 控制 台 看 到 输出 信息 与 结果 。 


6.2 REAR EH 


本 节 将 在 上 一 节 的 基础 上 重点 介绍 如 何 使 用 图 像 像素 的 算术 平均 值 实现 灰 度 图 像 转换 为 二 值 图 像 ， 同 时 还 重点 介绍 一 种 类 似 一 维 Meanshift 的 算法 来 实现 灰 度 图 像 转换 为 二 值 图 像 ， 希 望 读者 通过 这 两 
种 方法 的 学 习 ， 能 够 掌握 在 从 灰 度 到 二 值 的 过 程 中 如 何 正确 找到 阅 值 这 一 关键 值 ， 在 实现 图 像 二 值 化 的 同时 保留 图 像 原 有 信息 不 丢失 。 


笔者 在 2004 年 第 一 次 接触 图 像 编 程 时 ， 做 的 第 一 个 图 像 程序 就 是 把 自己 的 照片 变 成 一 张 黑 白 二 值 图 像 ， 用 的 方法 是 只 要 像素 值 大 于 127 就 赋值 为 白色 像素 (255) ， 反 之 则 为 黑色 (0) 。 但 是 当 笔 者 的 
指导 老师 问 为 什么 选择 127 作 为 阅 值 、 依 据 是 什么 时 ， 笔 者 一 下 子 慌 了 ， 因 为 笔者 从 来 没有 想 过 这 个 问题 。 显 然 它 不 是 一 种 很 好 的 二 值 化 方法 ， 但 是 直到 今天 ， 如 果 你 问 一 个 程序 员 如 何 二 值 化 一 张 图 像 ， 
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利用 图 像 算 术 平 均值 来 实现 图 像 的 二 值 化 时 ， 处 理 步骤 大 致 可 以 分 为 如 下 两 步 : 
1) 计算 输入 图 像 像 素 的 算术 平均 值 一 一 mean.。 
2) 利用 该 平均 值 作为 闪 值 ， 如 果 像 素 值 P (x, y) >mean, $P (x, y) 2-255, AWP (x, y) =0. 


实现 代码 如 下 : 


// calculate mean， MAX， MIN 

int max = 0; 

int min = 255; 

double sum = 0.0; 

for (int row = 0; row < height; rowt+) { 
int tr = 0; 


for (int col = 0; col < width; col++) { 
index = row * width + col; 
tr = (pixels[index] >> 16) & Oxff; 
min = Math.min (min, tr) ; 
max = Math.max (max, tr) ; 
sum += tr; 


} 
mean = sum / (width * height) ; 


2. 基 于 一 维 MeanShift 方 法 计算 阅 值 实现 二 值 化 

该 方法 的 大 致 步骤 如 下 : 

1) 给 定 一 个 初始 化 阅 值 T (可 以 随机 生成 ， 或 者 直接 为 127) 。 

2) 根据 像素 值 P Qx, y) 与 阔 值 [的 比较 结果 ， 将 其 分 为 对 象 像素 集合 G1 与 背景 像素 集合 G2。 
3) 计算 G1 与 G2 的 像素 平均 值 M1、M2.。 

4) 得 到 新 的 辣 值 7" = (M1+M2) /2。 

5) 比较 T 与 T 是 否 相等 ， 如 果 不 等 ， 则 令 T=T， 重 复 第 2~5 步 。 

6) 最 终 得 到 的 T 值 作为 阔 值 ， 像 素 值 大 于 T 即 为 白色 ， 反 之 为 黑色 。 


使 用 该 方法 时 ， 执 行 到 第 5 步 还 可 以 通过 获取 差 值 来 进行 计算 ， 如 果 差 值 小 于 一 定 范 围 ， 则 停止 循环 计算 新 的 T 值 。 用 该 方法 来 寻找 阔 值 相对 更 加 精准 ， 但 是 计算 量 较 大 。 


代码 实现 如 下 : 

int inithreshold = 127; 

int finalthreshold - 0; 

int temp[] = new int[inPixels.length]; 

for (int index-0; index<inPixels.length; indext+) { 
temp[index] = (inPixels[index] >> 16) & Oxff; 


=] 


ist«Integer» subl = new ArrayList<Integer> () ; 

List<Integer> sub2 = new ArrayList<Integer> () ; 

int meansl = 0, means2 = 0; 

while (finalthreshold ! = inithreshold) { 

Finalthreshold = inithreshold; 

for (int i=0; i<temp.length; i++) { 

if (temp[i] <= inithreshold) { 
subl.add (temp[i]) ; 

} else { 
sub2.add (temp[i]) ; 


} 
} 
meansl = getMeans (subl) ; 
means2 = getMeans (sub2) ; 
subl.clear () ; 
sub2.clear () ; 


inithreshold = (meansl + means2) / 2; 
} 
long start = System.currentTimeMillis () ; 
System.out.println ("Final threshold = " + finalthreshold) ; 
long endTime = System.currentTimeMillis () - start; 
System.out.println ("Time consumes : " + endTime) ; 
return finalthreshold; 


完整 二 值 化 灰 度 图 像 的 代码 如 下 ， 可 以 通过 参数 设置 来 选择 哪 种 方法 实现 二 值 化 。 


package com.book.chapter.six; 

import java.awt.image.BufferedImage; 
import java.util.ArrayList; 
import java.util.List; 
import com.book.chapter.four.AbstractBufferedImageOp; 
public class BinaryFilter extends AbstractBu 
public final static int MEAN THRESHOLD - 2; 
public final static int SHIFT THRESHOLD - 4; 
p 
p 


rivate int thresholdType; 
ublic BinaryFilter () { 
thresholdType = MEAN THRESHOLD; 


} 
public int getThresholdType () { 
return thresholdType; 


public void setThresholdType (int thresholdType) { 
this.thresholdType = thresholdType; 


@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 


dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 


getRGB (src, 0, 0, width, height, inPixels) ; 
int index - 0; 
int means = (int) getThreshold (inPixels, height, width) ; 
for (int row = 0; row < height; rowt+) { 
int ta = 0, tr = 0, tg=0, tb= 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 
if (tr > means) { 
tr = tg = tb = 255; // white 
} else { 
tr = tg = tb = 0; // black 
} 
outPixels [index] = (ta << 24) | (tr << 16) | (tg << 8) | tb; 
} 
} 
SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 
} 
private double getThreshold (int[] pixels, int width, int height) { 
int index = 0; 
double mean = 0; 


if (thresholdType == MEAN THRESHOLD) { 

// calculate mean, MAX, MIN 

int max = 0; 

int min = 255; 

double sum = 0.0; 

for (int row = 0; row < height; rowt+) { 
int tr = 0 
for (int col = 0; col < width; col++) { 


index = row * width + col; 


tr = (pixels[index] >> 16) & Oxff; 
min = Math.min (min, tr) ; 
max = Math.max (max, tr) ; 


sum += tr; 
} 
} 
mean = sum / (width * height) ; 
} else if (thresholdType == SHIFT THRESHOLD) { 
mean = getMeanShiftThreshold (pixels, height, 


width) ; 


return mean; 
} t 
private 
int 
int 
for ( 
result 


static int getMeans (List<Integer> data) { 
result = 0; 
size = data.size () ; 
Integer i: data) { 
+= i; 


} 
return 
} 
private int getMeanShiftThreshold (int[] inPixels, int height, 
// maybe this value can reduce the calculation consume; 
int inithreshold = 127; 
int finalthreshold = 0; 
int temp[] = new int[inPixels. length]; 
for (int index = 0; index < inPixels.length; indext+) { 
temp[index] = (inPixels[index] >> 16) & Oxff; 


(result / size) ; 


int width) { 


} 

List<Integer> subl = new ArrayList«I 

List<Integer> sub2 = new ArrayList«I 

int meansl = 0, means2 = 0; 

while (finalthreshold ! = inithreshold) | 

Finalthreshold = inithreshold; 

for (int i= 0; i < temp.length; 

if (temp[i] <= inithreshold) { 
subl.add (temp[i]) ; 

} else { 
sub2.add (temp[i]) ; 


teger> () ; 
teger> () ; 


=] 


=] 


i++) { 


} 
} 
meansl = getMeans (subl) ; 
means2 = getMeans (sub2) ; 
subl.clear () ; 
sub2.clear () ; 
inithreshold - 


(meansl + means2) / 2; 


} 
long start = System.currentTimeMillis () ; 

System.out.println ("Final threshold = " + finalthreshold) ; 
long endTime = System.currentTimeMillis () - start; 

" + endTime) ; 


System.out.println ("Time consumes : 
return finalthreshold; 


测试 BinaryFilter 类 时 ， 同 样 只 需要 在 第 3 章 中 提 到 的 ImagePane| 的 process 方 法 中 添加 如 下 代码 ， 


BinaryFilter () ; 
null) ; 


filter = new 
filter.filter (sourceImage, 


BinaryFilter 
destImage = 


选择 一 张 灰 度 图 像 ， 然 后 单 击 【处 理 】 按 钮 即 可 查看 效果 。 


D) 


63 图像 直方 


图 像 直 方 图 是 图 像 处 理 中 最 重要 的 概念 之 一 ， 在 各 种 天 于 图 像 处 理 的 书籍 中 都 可 以 看 到 它 的 身影 。 


然后 在 Eclipse 中 运行 MainUljava 即 可 。 


在 介绍 直方 概念 之 前 I 请 看 一 下 图 6 = 1 o 
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在 图 6-1 中 ，X 轴 坐标 0~255 代 表 像素 值 的 取 值 范围 ，Y 轴 则 表示 0~255 之 间 的 各 个 整数 在 像素 数组 中 的 出 现 频率 。 假 设 一 幅 图 像 的 像素 数组 P = (233, 2, 4, 4, 233, 4, 4}, AYES HIBACHI 
出 现 频率 为 4， 值 为 233 的 像素 出 现 频 率 为 2， 值 为 2 的 像素 出 现 频率 为 1。 通 过 这 样 的 简单 计算 ， 即 可 得 到 0~255 各 个 值 在 像素 数组 出 现 的 频率 。 然 后 就 可 以 根据 像素 值 与 出 现 频率 之 间 的 对 应 关系 生 成 直方 


图 ， 即 图 像 像素 直方 图 。 计 算 直 方 图 的 数学 公式 如 下 : 
/ / ( i ) 


其 中 M =image_width x image height, h (9) 表示 灰 度 为 9 的 像素 出 现 频率 ，g 的 取 值 范围 为 0~255 之 间 。 所 以 直方 图 的 数学 公式 还 可 以 为 : 


— "PN " 
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& M M 


直方 图 的 意义 在 于 可 以 通过 它 直 观 地 观察 到 图 像 的 对 比 度 、 亮 度 ， 通 过 直方 图 均衡 化 、 直 方 图 匹配 也 可 实现 对 图 像 的 调整 ， 得 到 各 种 想 要 的 处 理 结果 。 在 学 习 了 直方 图 相关 简单 数学 知识 以 后 ， 我 们 一 
起 学 习 如 何 通过 编程 实现 图 像 直 方 图 。 这 里 使 用 的 图 像 是 灰 度 图 像 ，RGB 图 像 的 处 理 与 其 类 似 ， 只 是 在 三 个 分 量 上 分 别 绘制 出 对 应 的 三 个 直方 图 。 


编程 绘制 直方 图 首先 要 获取 图 像 的 直方 图 数据 ， 然 后 通过 Swing 2D 实 现 直 方 图 的 绘制 与 显示 ， 所 以 整个 过 程 大 致 可 以 分 为 如 下 两 步 。 


1) 统计 图 像 像 素 值 出 现 的 频率 ， 获 取 直 方 图 数据 ， 实 现代 码 如 下 : 


// get histogram data 

int[] histogram = new int[256]; 

for (int i=0; i«histogram.length; i++) 
{ 


} 
for (int row = 0; row < height; row++) { 
int tr = 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
tr = (inPixels[index] >> 16) & Oxff; 
histogram[tr]++; 


histogram[i] = 0; 


} 
} 
double maxFrequency = 0; 
for (int i=0; i«histogram.length; i++) 
1 


} 


maxFrequency = Math.max (maxFrequency, histogram[i]) ; 


2) 在 进行 Swing 2D 直 方 图 的 绘制 时 ， 首 先 绘制 XY 轴 ， 然 后 根据 直方 图 数据 绘制 图 形 ， 代 码 如 下 : 


// render the histogram graphic 

Graphics2D g2d - dest.createGraphics () ; 
g2d.setPaint (Color.LIGHT GRAY) ; 

g2d.fillRect (0, 0, width, height) ; 

// draw XY Axis 

g2d.setPaint (Color.BLACK) ; 

g2d.drawLine (50, 50, 50, height - 50) ; 
g2d.drawLine (50, height-50, width-50, height - 50) ; 
// draw XY Title 

g2d.drawString ("O", 50, height-30) ; 
g2d.drawString ("255", width-50, height-30) ; 
g2d.drawString ("0", 20, height-50) ; 
g2d.drawString ("" + maxFrequency, 20, 50) ; 
// draw histogram bar 

double xunit (width - 100.0) /256.0d; 

double yunit (height - 100.0) /maxFrequency; 
for (int i=0; i«histogram.length; i++) 

{ 


double xp = 50 + xunit * i; 

double yp = yunit * histogram[i]; 

Rectangle2D rect2d = new Rectangle2D. 

Double (xp, height - 50 - yp, xunit, yp); 
g2d.fill (rect2d) ; 


a 


运行 与 测试 图 像 直方 图 程序 同样 只 需要 在 第 3 章 中 提 到 的 ImagePaneI 的 process 方 法 中 添加 如 下 代码 即 可 : 


HistogramFilter filter = new HistogramFilter () ; 
destImage = filter.filter (sourceImage, null) ; 


程序 运行 的 结果 图 像 如 图 6-2 所 示 。 


图 6-2 图像 lena_gray.png 与 其 对 应 灰 度 直方 图 
对 于 上 面 的 运行 结果 ， 左 侧 为 原始 输入 图 像 ， 右 侧 为 该 图 像 对 应 的 直方 图 。 图 像 直方 图 完整 的 源 程序 清单 HistogramFilterjava 参 见 本 书 下 载 源 代 码 的 对 应 章节 。 


上 面 讲 述 了 灰 度 图 像 的 直方 图 实现 ，RGB 彩 色 图 像 直方 图 的 实现 步骤 与 灰 度 直 方 图 处 理 大 致 相同 ， 只 是 要 在 RGB 三 个 颜色 通道 上 进行 处 理 ， 实 现 的 代码 如 下 : 


package com.book.chapter.six; 
import java.awt.Color; 
import java.awt.Graphics2D; 

import java.awt.geom.Rectangle2D; 

import java.awt.image.Bufferedlmage; 

import com.book.chapter.four.AbstractBufferedImageOp; 

public class RGBHistogramFilter extends AbstractBufferedImageOp { 
public RGBHistogramFilter () 

{ 


System.out.println ("Colorful Histogram") ; 
} 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
getRGB (src, 0, 0, width, height, inPixels) ; 
int index = 0; 
// get histogram data 
int[][] histogram = new int[3] [256]; 
for (int i=0; i<histogram.length; i++) 


histogram[0] [i] = 0; 
histogram[1] [i] = 0; 
histogram[2] [i] = 0; 


for (int row = 0; row < height; rowt+) { 
int ta = 0, tr=0, tg= 0, tb= 0; 

for (int col = 0; col < width; col++) { 

index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg (inPixels[index] >> 8) & Oxff; 


t inPixels[index] & Oxff; 
histogram[0][tr]++; // red 
histogram[1] [tg]++; // green 
histogram[2] [tb]++; // blue 


} 
} 
double[] maxRGBFrequency = new double[]{0, 0, 0}; 
for (int i-0; i<histogram[0].length; i++) 
{ 


maxRGBFrequency[0] = Math.max (maxRGBFrequency [0], 0 
maxRGBFrequency[1] Math.max (maxRGBFrequency[1], histogram[1] [i 
maxRGBFrequency[2] = Math.max (maxRGBFrequency [2], j 2 


// render the histogram graphic 
Graphics2D g2d = dest.createGraphics () ; 
g2d.setPaint (Color.LIGHT GRAY) ; 
g2d.fillRect (0, 0, width, height) ; 
double max = Math.max (maxRGBFrequency [2], 
Math.max (maxRGBFrequency[0], maxRGBFrequency[1]) ) ; 

// draw XY Axis 
g2d.setPaint (Color.BLACK) ; 
g2d.drawLine (50, 50, 50, height - 50) ; 
g2d.drawLine (50, height-50, width-50, height - 50) ; 
// draw XY Title 
g2d.drawString ("0", 50, height-30) ; 
g2d.drawString ("255", width-50, height-30) ; 
g2d.drawString ("0", 20, height-50) ; 
g2d.drawString ("" + max, 20, 50) ; 
// draw histogram bar 
double xunit = (width - 100.0) /256.0d; 
double yunit = (height - 100.0) /max; 
g2d.setPaint (Color.RED) ; 
for (int i=0; i<histogram[0].length; i++) 
{ 
double xp = 50 + xunit * i; 

double yp = yunit * histogram[0] [i]; 

Rectangle2D rect2d = new Rectangle2D. 
Double (xp, height - 50 - yp, xunit, yp); 
1 (rect2d) ; 
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g2d. fi 


g2d.setPaint (Color.GREEN) ; 
for (int i=0; i<histogram[1].length; i++) 


double xp = 50 + xunit * i; 

double yp = yunit * histogram[1] [i]; 

Rectangle2D rect2d = new Rectangle2D. 

Double (xp, height - 50 - yp, xunit, yp); 
(rect2d) ; 


g2d. fi 


po 
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g2d.setPaint (Color.BLUE) ; 
for (int i-0; i«histogram[2].length; i++) 


double xp = 50 + xunit * i; 

double yp = yunit * histogram[2]lil; 

Rectangle2D rect2d - new Rectangle2D. 

Double (xp, height - 50 - yp, xunit, yp) ; 
1 (rect2d) ; 


g2d.fi 


= 


} 


return dest; 


测试 彩色 图 像 只 要 修改 ImagePanel.java 中 的 process 方 法 ， 添 加 如 下 代码 即 可 : 


RGBHistogramFilter filter = new RGBHistogramFilter () ; 
destImage = filter.filter (sourceImage, null) ; 


然后 在 Eclipse 中 运行 MainUljava。 


64 基于 直方 图 实现 图 像 二 值 化 


本 节 将 学 习 通 过 直方 图 的 数据 寻找 合适 的 冰 值 ， 并 实现 灰 度 图 像 的 二 值 化 。 首 先 看 一 下 下 面 的 直方 图 (如 图 6-3 所 示 ， 其 对 应 的 灰 度 图 像 为 lena_gray.png) . 
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图 6-3 lena_gray.png 对 应 的 灰 度 直方 图 


观察 图 6-3 不 难 发 现 ， 有 两 个 比较 明显 的 波 谷 ， 一 个 靠近 0， 一 个 靠近 255。 所 以 从 直方 图 上 可 以 判断 合适 的 二 值 化 阔 值 应 该 在 这 两 个 波 谷 之 间 。 假 设 第 一 个 波 谷 的 值 为 T1， 第 二 个 波 谷 的 值 为 T2， 则 大 
2. Tm 

致 计算 阔 值 的 公式 为 ”2 。 但 是 当 图 像 直方 图 为 如 图 6-4 所 示 的 结果 时 ， 显 然 ， 此 时 合适 的 二 值 化 图 像 阐 值 应 该 是 在 波峰 位 置 左 右 ， 所 以 只 要 在 直方 图 上 通过 Java 2D 绘 制 出 一 条 可 以 支持 鼠标 拖 动 

的 直线 ， 实 时 显示 阅 值 与 图 像 二 值 化 以 后 的 结果 ， 通 过 不 断 尝 试 就 可 以 得 到 想 要 的 阐 值 与 二 值 图 像 。 显 然 ， 这 样 的 程序 在 多 数 的 图 像 处 理 与 编辑 软件 中 非常 常见 ， 下 面 就 一 起 通过 编码 来 实现 该 程序 。 首 先 


看 看 实现 的 各 个 类 之 间 的 关系 图 ， 如 图 6-5 所 示 。 
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图 6-4 直方 图 二 


<<interlace>> 
MouseAdapter ViewCall Back JPanel 


+ mouseDragged(MouseEvent):void + mooveLine(double):void + repaint():void 


+ mousePressed(MouseEvent):void 
+ mouseheleased(Mouselvent):void 


RedLineMonitor ; 
HistogramPanel 


+ mouseDragged(MouseEvent):void 


iin + mooveLine(double):void 
+ mousePressed(MouseEvent):void li | 

| + i , + repaint():void 
+ mouseReleased(MouseEvent):void | 


图 6-5 各 个 类 之 间 的 关系 图 


其 中 
- RedLineMonitorZe: 实现 鼠标 移动 位 置 的 捕获 。 


: HistogramPanel 4: 实现 直方 图 的 显示 与 阅 值 直线 移动 ， 根 据 据 标 位 置 计算 出 直方 图 上 的 阅 值 。 


San Esel ieu (E E SR Se F : 


int width = (int) size.getWidth () ; 
int height = (int) size.getHeight () ; 
double maxFrequency - 0; 

for (int i=0; i<data.length; i++) 

{ 


maxFrequency = Math.max (maxFrequency, data[i]) ; 


// vender the histogram graphic 

Graphics2D g2d = histogramImage2.createGraphics () ; 
g2d.setPaint (Color.LIGHT GRAY) ; 

g2d.fillRect (0, 0, width, height) ; 

// draw XY Axis 
g2d.setPaint (Color.BLACK) ; 

g2d.drawLine (50, 50, 50, height - 50) ; 

g2d.drawLine (50, height-50, width-50, height - 50) ; 
// draw XY Title 

g2d.drawString ("0", 50, height-30) ; 

g2d.drawString ("255", width-50, height-30) ; 
g2d.drawString ("0", 20, height-50) ; 

g2d.drawString ("" + maxFrequency, 20, 50) ; 


// draw histogram bar 
double xunit = (width - 100.0) /256.0d; 
double yunit = (height - 100.0) /maxFrequency; 


for (int i=0; i«data.length; i++) 
{ 


double xp = 50 + xunit * i; 

double yp = yunit * data[i]; 

Rectangle2D rect2d = new Rectangle2D. 

Double (xp, height - 50 - yp, xunit, yp) ; 
g2d.fill (rect2d) ; 


/ render red line 
f ( (linePos - 50) >= 0 && (width - linePos) >= 50) 


a p. 


threshold = (int) ( (linePos - 50) / xunit) ; 
linePos = 50 + xunit * threshold; 
g2d.setPaint (Color.RED) ; 
g2d.drawLine ( (int) linePos, 50, 

(int) linePos, height - 50) ; 
g2d.drawString (" 阅 值 : "+threshold, 

(int) linePos-10, 50) ; 


HistogramDataExtractor 类 : 用 来 提取 输入 图 像 的 直方 图 数据 ， 然 后 根据 直方 图 数据 选择 赚 值 实现 灰 度 图 像 二 值 化 。 实 现 的 代码 如 下 : 


package com.book.chapter.six; 

import java.awt.image.BufferedImage; 

import com.book.chapter.four.AbstractBufferedImageOp; 

public class HistogramDataExtractor extends 

AbstractBufferedImageOp { 

private int threshold = -1; 

public void setThreshold (int threshold) { 
this.threshold = threshold; 


} 
private int[] histogram; 
public int[] getHistogram () { 
return histogram; 


} 
public void setHistogram (int[] histogram) { 
this.histogram = histogram; 


} 
@Override 
public BufferedImage fi 


M 


ter (BufferedImage src, 
BufferedImage dest) { 
int width = src.getWidth () ; 

int height = src.getHeight () ; 

if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 

getRGB (src, 0, 0, width, height, inPixels) ; 
int index - 0; 

// get histogram data 

histogram = new int[256]; 

for (int i-0; i<histogram.length; i++) 


histogram[i] = 0; 


for (int row = 0; row < height; rowt+) { 
int tr = 0; 

for (int col = 0; col < width; col++) { 

index = row * width + col; 

tr = (inPixels[index] >> 16) & Oxff; 

histogram[tr]++; 


} 


f (threshold > 0) 


we 


a H- 


// binary image 
int[] outPixels = new int[width*height]; 
for (int row-0; row«height; rowt+) { 
int ta = 0, tr 2-0, tg=0, tb= 0; 
for (int col=0; col«width; col++) { 
index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 


if (tr >=threshold) | 


nia tg = tbh = 255; 
} else { 
tr = tg = tbh = 0; 


} 
outPixels[index] = (ta << 24) | (tr << 16) 
| (tg << 8) | tb; 


} 
} 
SetRGB ( dest, 0, 0, width, height, outPixels ) ; 


} 


return dest; 


iya 


上 述 三 个 类 实现 以 后 ， 只 需要 在 lImagePanel 的 process 方 法 中 添加 如 下 代码 即 可 调用 : 


final HistogramDataExtractor extractor = 
new HistogramDataExtractor () ; 
destImage = extractor.filter (sourceImage, null) ; 
int[] histData = extractor.getHistogram () ; 
final HistogramPanel uiPanel = new 
HistogramPanel (destImage, histData) ; 
RedLineMonitor lineListener = new RedLineMonitor (uiPanel) ; 
uiPanel.addMouseListener (lineListener) ; 
uiPanel.addMouseMotionListener (lineListener) ; 
uiPanel.setupActionListener (new ActionListener () { 
@Override 
public void actionPerformed (ActionEvent e) { 
extractor.setThreshold (uiPanel.getThreshold () ) ; 
destImage = extractor.filter (sourceImage, null) ; 


refresh () ; 
} 
}) ; 


uiPanel.openView () ; 


然后 运行 MainUl.java 即 可 查看 整个 程序 的 运行 效果 ， 如 图 6-6 所 示 。 


图 6-6 直方 图 二 值 化 运行 结果 


在 图 6-6 中 ， 最 左边 的 是 输入 图 片 lena_gray.png， 右 边 的 是 二 值 化 以 后 的 图 像 ， 对 话 框 中 是 直方 图 图 像 ， 其 中 的 直线 ， 鼠 标 拖 动 时 会 移动 并 且 改 变 显 示 值 。 本 节 完 整 的 源 代 码 文件 请 下 载 阅览 。 


65 ”应 用 一 一 直方 图 均衡 化 


本 节 重 点 介绍 一 种 修改 直方 图 分 布 的 算法 一 一 直方 图 均衡 化 ， 通 过 该 方法 实现 对 图 像 的 增强 与 提高 ， 获 得 更 好 的 图 像 修复 效果 ， 首 先 来 看 一 下 直方 图 均衡 化 的 数学 表达 与 理论 计算 。 假 设 : 
输入 图 像 的 灰 度 级 别 为 rE[0，1]， 变 换 以 后 图 像 的 灰 度 级 别 为 sE[0，1]， 则 可 以 得 到 s=T (r), AFT (r) 为 变换 公式 。 


对 于 一 幅 离 散 的 数字 图 像 来 说 ， 均 衡 化 变换 公式 可 以 表示 为 : 


5, = Tir) = >, Pr(rj) = 2 - 


j-0 j=l 


其 中 Pr (r) 是 图 像 直 方 图 公式 。 

下 面 介绍 一 下 灰 度 图 像 直方 图 均衡 化 步 又: 
1) 计算 输入 图 像 的 直方 图 统计 。 

2) 根据 直方 图 均衡 化 公式 计算 变换 后 的 直方 图 。 
3) 重新 映射 到 像素 值 ， 实 现 图 像 调整 。 
下 面 是 彩色 RGB 图 像 直 方 图 均衡 化 步骤 : 
1) 将 像素 从 RGB 转换 到 HSl 色 彩 空间 。 

2) 计算 | 分 量 的 直方 图 统计 数据 。 

3) 直方 图 均衡 化 。 

4) 重新 映射 ! 值 到 各 个 像素 。 

5) 将 像素 从 HSI 转 换 到 RGB 色彩 空间 。 


从 上 面 可 以 观察 到 ， 灰 度 图 像 与 彩色 图 像 的 直方 图 均衡 化 唯一 不 同 的 是 ， 彩 色 图 像 需 要 将 像素 值 从 RGB 色彩 空间 转换 到 HSI 色 彩 空 间 ， 之 后 的 处 理 与 灰 度 图 像 类 似 。 最 后 还 需要 将 像素 值 从 HSI 转 换 到 
RGB 色彩 空间 ， 即 可 得 到 最 终 效果 。 
下 面 就 来 具体 学 习 RGB 色 彩 空间 与 HSI 色 彩 空间 相互 转换 的 知识 ，RGB 到 HSlI 色 彩 空间 转换 遵循 以 下 步骤 : 
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3) 根据 HSI 的 取 值 范 围 分 别 为 HE[0，360]、sE[0，100]、IE[0，255] 得 到 


h x 180/m:; 5S = s x 100; / = i x255 


从 HSI 色 彩 空 间 到 RGB 色彩 空间 则 需要 如 下 计算 步骤 方 可 完成 : 


h = COS 


1) 首先 归 一 化 HSI 值 : hz" “iso, s=S/100, i=1/255 


2) 计算 中 间 过 程 三 个 分 量 值 x、y、z: 
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上 述 RGB 与 HS 色彩 空间 相互 转换 的 方法 为 几何 推导 法 ， 至 于 公式 是 如 何 推导 出 来 的 ， 感 兴趣 的 读者 可 以 自己 研究 。 这 里 主要 是 学 会 根据 公式 实现 应 用 ， 解 决 实际 问题 。 首 先 看 一 下 实现 RGB 与 HSI 色 彩 


空间 相互 转换 的 代码 。 


RGB 转换 到 HSl 色 彩 空间 的 代码 如 下 : 


double[] rgb2HSI (int[] rgb) 
{ 


sum = rgb[0] + rgb[1] + rgb[2]; 


le 
double r = rgb[0] / sum; 
double g = rgb[1] / ee 
double b = rgb[2] 
double sl = ( (r- j ps E b) ) /2 
double s2 = Math.pow ( (r-g) , 2) ps "gs b) * (g-b) ; 
double s3 = s1/Math.sqrt (s2) ; 
le h = 0.0f; 


p 
— 
o 
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h = Math.acos (s3) ; 
} 
else if (b»g) 
{ 
h = 2*Math.PI - Math.acos (s3) ; 


double s = 1 - 3*Math.min (r, Math.min (g, b) ) ; 
double i = sum / (255.0 * 3.0) ; 

// 得 到 输出 值 

double H= ( (h* mr 0) /Math.PI) ; 

double S = s * 1 

double I = i * ee 

return new double[]{H, S, I}; 


HSI 转 换 到 RGB 色彩 空间 的 代码 如 下 : 


int[] hsi2RGB (double[] hsi) 
{ 


double h = (hsi[0] * Math.PI) /180.0; 

double s = hsi[1] / 100.0; 

double i = hsi[2] /255.0; 

double x = i* (1-s) ; 

double y = i* (1 + (s*Math.cos (h) ) /Math.cos (Math.PI/3.0 - h) ) ; 
double z = 3*i - (x+ y); 

double r-0, g=0, b=0; 

if (h< ( (2*Math. PI) /3) ) 


b = x; 
c= y; 
g = Z; 


else if (h >= ( (2*Math.PI) /3 && h< ( (4*Math.PI) /3) ) 


h - ( (2*Math.PI) 73.0) 3 
i* (LS); 

(1 + (s*Math.cos (h) ) /Math.cos (Math.PI/3.0 - h) ) ; 
(x + y); 
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>= ( (4*Math.PI) /3 && h< ( (2*Math.PI) ) ) 


h-h- ( (4*Math.PI) /3.0) ; 

x = i* (1-s) ; 

y = ix (1 + (s*Math.cos (h) ) /Math.cos (Math.PI/3.0- h) ) ; 
g ed*Lo (x +y); 

g = X; 

b =y; 

1 = 


Z; 


int red = (int) (r * 255) ; 

int green = (int) (g * 255) ; 

int blue = (int) (b * 255) ; 

return new int[]{red, green, blue}; 


解决 了 像素 色彩 空间 转换 问题 之 后 ， 彩 色 图 像 的 直方 图 均衡 化 就 很 容易 通过 编码 实现 了 。 下 面 是 实现 彩色 图 像 直方 图 均衡 化 HistogramEFilter 类 的 关键 代码 : 


public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if ( dest = null ) 
dest = createCompatibleDestImage ( src, null ) ; 
int[] inPixels = new int[width*height] ; 
double[][] hsiPixels = new double [3] [width*height]; 
int[] outPixels = new int[width*height] ; 
getRGB ( src, 0, 0, width, height, inPixels ) ; 
int[] iDataBins = new int[256]; // RGB 
int[] newiBins = new int[256]; // after HE 
for (int j-0; 4<256; j++) { 
iDataBins[j] = 0; 
newiBins[j] = 0; 


int index = 0; 

int totalPixelNumber = height * width; 
for (int row-0; row«height; rowt+) { 
int ta- 0, tr=0, tg=0, tb= 0; 
for (int col=0; col«width; col++) { 
index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = Ce | >> 8) & Oxff; 


t inPixels[index] & Oxff; 
double[] hsi = rgb2HSI (new int[]{tr, tg, thb}) ; 
iDataBins[ (int) hsi[2]]++; 


hsiPixels[0] [index] = hsi[0]; 
hsiPixels[1] [index] = hsi[l]; 
hsiPixels[2] [index] = hsi[2]; 


} 
} 
// generate original source image RGB histogram 
generateHEData (newiBins, iDataBins, totalPixelNumber, 256) ; 
for (int row-0; row<height; rowt+) { 

int ta = 255, tr=0, tg=0, th=0; 
for (int col=0; col<width; col++) { 

index = row * width + col; 


// get output pixel nowhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/OEBPS/Text/... 
double h = hsiPixels[0][index]; 

double s = hsiPixels[1][index]; 

double i= newiBins[ 


a 


int) hsiPixels[2] [index] ]; 


int[] rgb = hsi2RGB (new double[]{h, s, i}) ; 
tr = clamp (rgb[0]) ; 
tg = clamp ee 
tb = clamp (rgb[2]) ; 
outPixels[index] = (ta << 24) 
| (tr << 16 | (tg << 8) | tb; 


} 


SetRGB ( dest, 0, 0, width, height, outPixels ) ; 
return dest; 


完整 的 HistogramEFilter 类 代码 请 从 前 言 中 所 述 网 站 下 载 阅 览 。 测 试 直方 图 均衡 化 时 ， 只 需要 在 ImagePane| 的 process 方 法 中 添加 如 下 代码 : 


HistogramEFilter heFilter = new HistogramEFilter () ; 
destImage = heFilter.filter (sourceImage, null) ; 


然后 运行 MainUljava 即 可 查看 效果 ， 本 节 的 测试 图 片 为 lena.png。 


Quse 如 果 没 有 特殊 说 明 ， 本 书 所 用 到 的 灰 度 图 片 资源 均 为 lena_gray.png， 彩 色 图 片 均 为 lenapng， 当 然 读 者 也 可 以 选择 自己 想 要 的 图 片 来 测试 程序 效果 。 


6.6 应 用 一 一 基 于 直方 图 的 图 像 搜索 


本 节 将 基于 直方 图 做 图 像 相似 度 的 比较 ， 实 现 以 图 搜 图 的 应 用 ， 这 在 实际 项 目 中 是 一 种 很 实用 的 技术 。 当 前 实现 图 像 匹配 的 算法 多 数 是 基于 图 像 特征 查找 的 ， 首 先 提 取 图 像 特征 ， 然 后 根据 特征 值 进行 
分 析 与 计算 ， 从 而 实现 图 像 匹 配 。 最 常见 的 是 基于 sift 的 算法 实现 ， 但 是 计算 量 较 大 。 这 里 介绍 一 种 基于 图 像 直方 图 实现 的 图 像 匹配 算法 ， 优 点 是 计算 量 小 ， 相 比 sift 算 法 ， 原 理 简单 ， 只 需要 少许 数学 知识 
即 可 。 


1. 基 本 原理 


通过 分 析 比 较 两 幅 图 像 的 直方 图 数据 ， 从 而 确定 这 两 幅 图 像 的 相似 度 ， 首 先 获取 图 像 的 直方 图 数据 ， 接 着 计算 两 个 直方 图 数据 之 间 的 差异 ， 可 以 选择 的 计算 两 组 数据 差异 与 距离 的 公式 有 巴 氏 距离 、 欧 


几 里 得 距离 、 地 球 移动 距离 等 ， 最 终 得 到 一 个 相似 度 输出 值 。 


2. 实 现 图 像 相似 度 分 析 步 又 


具体 步骤 如 下 : 


1) 提取 输入 图 像 的 直方 图 数据 。 


2) 根据 输入 图 像 的 直方 图 数据 ， 运 用 距离 公式 对 每 一 个 待 比较 图 像 实现 相似 度 计算 。 


3) 显示 图 像 的 对 比 度 信息 。 


3. 程 序 难 点 剖析 : 彩色 图 像 的 直方 图 表示 


彩色 图 像 RGB 拥有 三 个 色彩 分 量 ， 每 个 分 量 都 可 以 表示 为 一 个 直方 图 ， 所 以 首先 要 做 的 就 是 如 何 用 一 个 直方 图 表示 RGB 三 个 分 量 颜色 值 的 变化 ， 通 党 的 做 法 就 是 将 RGB 颜色 值 的 取 值 学 围 进行 分 段 表 
示 ， 将 0 到 255 的 颜色 值 分 为 16 个 灰 度 级 别 ， 每 个 灰 度 级 别 拥有 16 个 灰 度 值 ， 这 样 RGB 直方 图 数据 就 可 以 通过 16x16x 16 的 一 维 数组 表示 出 来 了 。 对 于 给 定 的 任意 像素 P (r, g, b) ， 其 对 应 的 直方 图 数据 索 


5|73: 


index= (1/16) + (g/16) X16+ (b/16) X16X16 


任意 的 直方 图 数据 histogram[index]+ + ， 对 于 给 定 的 像素 P (r, g, b), & 
对 于 任意 一 幅 图 像 的 RGB 像素 值 ， 可 以 得 到 它 的 直方 图 数据 。 实 现代 码 如 下 : 


理 


- 


double[] bins = distanceType == EARTH MOVERS DISTANCE 


int width = image.getWidth () ; 

int height = image.getHeight () ; 

// 从 图 像 中 获取 像素 数据 

int[] inPixels = new int[width * height]; 

getRGB (image, 0, 0, width, height, inPixels) ; 
int index - 0; 

// 初始 化 直方 图 数据 

for (int i-0; i<bins.length; i++) 

{ 


} 

// 计算 RGB 每 个 分 量 的 16 bin&ügindex 

for (int row = 0; row < height; rowt+) { 
int tr = 0, tg-0, tb=0; 

for (int col = 0; col < width; col++) { 


bins[i] = 0; 


index = row * width + col; 
index = row * width + col; 


tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 


int level = 16; 
if (distanceType == EARTH MOVERS DISTANCE) 
{ 


level = 64; 
} 
int rbinIndex = tr / level; 
int gbinIndex = tg / level; 
int bbinIndex = tb / level; 


bins [binIndex]++; 


} 
} 
// 归 一 化 直方 图 数据 


float total = width * height; 
for (int i-0; i<bins.length; i++) 
{ 


} 


return bins; 


bins [i] = bins [il / total; 


4. 距 离 计 算 


在 获取 到 两 张 图 像 的 直方 图 数据 以 后 ， 就 可 以 进行 直方 图 数据 的 比较 了 。 从 统计 学 上 看 ， 直 方 图 数据 属于 统计 分 布 概率 ， 所 以 可 以 通过 比较 两 组 数据 之 间 的 距离 完成 。 在 这 里 为 计算 方便 ， 假 设 两 张 图 
像 的 大 小 一 臻 (对 于 大 小 不 一 致 的 图 像 ， 可 以 通过 resize 之 后 得 到 大 小 一 致 的 图 像 ， 然 后 再 进行 计算 ) ， 计 算 两 组 数据 距离 的 公式 最 常见 的 有 欧 几 里 得 距离 、 巴 氏 系数 与 地 球 移动 距离 。 下 面 分 别 介绍 如 何 


通过 这 三 种 距离 公式 来 计算 图 像 直方 图 的 相似 度 。 


(1) 欧 几 里 得 距离 


Istance 


其 中 N 表 示 图 像 的 总 像素 个 数 (widthxheight) ， 如 果 两 张 图 像 完全 一 致 ， 则 它 的 distance 为 0，distance 越 大 说 明 图 像 差别 越 大 。 基 于 欧 几 里 得 计算 图 像 直 方 图 相似 度 的 代码 如 下 : 


double sum = 0; 
for (int i-0; i<srcBins.length; i++) 


{ 
} 


return Math.sqrt (sum) ; 


sum += Math.pow ( (srcBins[i] - destBins[i]) , 


(2) 巴 氏 系数 


? new double[4*4*4] : new double[16*16*16]; 


2) 3 


int binIndex = rbinIndex + gbinIndex * (256/level) 
+ bbinIndex * (256/level) * (256/level) ; 


通道 通过 除 以 16 取 整 的 值 范围 为 [0~15]， 所 以 三 得 到 一 个 16x16x16 大 小 的 数组 的 直方 图 数据 。 根 据 上 述 原 
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其 中 pu 与 qu 分 别 表示 两 张 图 像 的 直方 图 数据 ， 计 算出 来 的 值 在 0~ 1 之 间 ，1 表 示 完 全 相同 ，0 表 示 完 全 不 相同 。 基 于 巴 氏 系数 比较 图 像 直方 图 相似 度 的 代码 如 下 : 


double[] mixedData = new double[srcBins.length]; 
for (int i-0; i«srcBins.length; i++ ) { 
mixedData[i] = Math.sqrt (srcBins[i] * destBins[i]) ; 


// The values of Bhattacharyya Coefficient 

// ranges from 0 to 1, 

double similarity = 0; 

for (int i=0; i«mixedData.length; i++) { 
similarity += mixedData[i]; 


// The degree of similarity 
return similarity; 


(3) 地 球 移动 距离 (EMD) 
Earth Mover’ s Distance 即 两 幅 图 随机 分 布 ， 其 中 一 个 可 以 看 成 是 地 表 不 规则 高 低 分 布 的 堆 ， 另 外 一 个 看 成 是 一 系列 孔 的 集合 ， 把 第 一 个 堆 填 到 第 二 个 孔 所 需要 的 最 小 距离 。 


所 以 从 本 质 上 看 ，EMD 是 transportation problem 算 法 问题 ， 就 是 一 系列 商品 提供 者 需要 把 商品 提供 给 一 系列 对 应 的 订购 者 ， 而 它们 之 间 的 距离 不 一 样 ， 订 购 数量 也 不 一 样 。EMD 的 数学 公式 为 : 
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其 中 ，di 索 示 Wpi 到 Wqj 之 间 的 距离 。 从 上 述 表达 式 可 以 看 出 ，EMD 文 持 长 度 可 变 的 数据 集 比较 ， 距 离 计算 更 加 灵活 。 根 据 上 述 数 学 公式 ， 实 现 直方 图 EMD 计 算 的 代码 如 下 : 


Signature sigl = getSignature (srcBins, 16) ; 
Signature sig2 = getSignature (destBins, 16) ; 
double dist = JFastEMD.distance (sigl, sig2, -1) ; 
return dist; 


这 里 特别 说 明 一 下 ， 如 何 基于 transportation problem 算 法 实现 EMD 计 算是 一 个 很 长 、 很 专业 的 话题 ， 其 中 涉及 的 算法 大 致 可 以 分 为 两 个 部 分 ， 第 一 步 是 寻找 与 计算 最 小 费用 ， 第 二 步 则 为 检测 计算 是 
否 已 经 是 最 小 费用 ， 如 果 不 是 则 继续 夫 代 计算 ，transportation problem 算 法 本 身 是 NP 问题 ， 更 具体 讨论 已 经 超出 了 本 节 内 容 范围 。 这 里 用 到 了 一 个 Java 版 EMD 的 算法 包 ， 可 以 很 方便 地 计算 两 组 直方 图 
数据 的 EMD 值 ， 对 EMD 算 法 感 兴趣 的 读者 可 以 阅读 本 书 对 应 章节 的 相关 代码 实现 。 对 于 两 张 完全 一 致 的 图 片 ，EMD 的 计算 结果 为 0， 两 张 图 像 差 异 越 大 ，EMD 计 算 结 果 值 越 大 ， 大 于 1 时 ， 基 本 上 可 以 认为 
是 完全 不 相同 的 图 片 。 


利用 上 述 三 种 方法 实现 图 像 比较 的 方法 compareTo， 其 代码 如 下 : 


int width = destImage.getWidth () ; 
int height = destImage.getHeight () ; 
if (width ! = srcImage.getWidth () 
|| height ! = srcImage.getHeight () ) 


{ 


throw new IllegalArgumentException 
("图 像 宽度 与 高 度 与 源 图 像 不 符合 ! ") ; 
} 
double[] destBins = calculateHistogram (destImage) ; 
if (getDistanceType () == EUCLIDEAN DISTANCE) 
{ 


return calculateEuclideanDis ( 
getSrcHistogramData () , destBins) ; 


else if (getDistanceType () == BHATTACHARYYA COEFFICIENT) 


return calculateBhattacharyya ( 
getSrcHistogramData () , destBins) ; 


} 


else 


{ 
} 


return calculateEmd (getSrcHistogramData () , destBins) ; 


只 需 对 HistogramComparisonFilter 类 进行 适当 的 初始 化 ， 然 后 调用 compareTo 方 法 即 可 比较 源 图 像 与 目标 图 像 的 相似 度 ， 调 用 实现 的 UI 代码 如 下 : 


HistogramComparisonFilter heFilter = new 
HistogramComparisonFilter (sourceImage, 
HistogramComparisonFilter.EARTH MOVERS DISTANCE) ; 

// File destFile = new File ("E: \\image\\testll.png") ; 

File destFile = new File ("E: \\image\\lena.png") ; 

try { 

BufferedImage toImage = ImagelO.read (destFile) ; 

double value = heFilter.compareTo (toImage) ; 

Graphics2D g2d = toImage.createGraphics () ; 

g2d.setPaint (Color.RED) ; 


g2d.drawString ("" + value, 50, 50) ; 
destImage = tolmage; 

) catch (IOException e) { 
// TODO Auto-generated catch block 
e.printStackTrace () ; 


} 
Qum 特别 要 提醒 的 是 对 HistogramComparisonFilter 中 compareTo () 方法 返回 值 的 处 理 ， 当 利用 欧 几 里 得 距离 与 地 球 移动 距离 计算 相似 度 时 ， 值 越 小 ， 图 像 越 相似 ，0 代 表 完 全 相同 。 而 基于 巴 氏 系数 
则 是 1 表示 完全 相同 ， 值 越 小 越 不 同 。 


本 节 中 提 到 的 其 他 类 与 程序 源 代码 请 下 载 阅览 ， 这 里 再 次 特别 强调 源 代码 也 是 本 书 的 一 部 分 ， 请 认真 阅读 与 对 待 。 


6.7 小 结 


本 章 从 统计 学 的 基本 数学 知识 入 手 ， 介 绍 了 统计 图 像 像 素 均值 、 最 大 值 与 最 小 值 、 方 差 等 图 像 像 素 的 统计 学 属性 ， 介 绍 了 根据 图 像 像 素 方差 阐 值 实现 过 滤 空 白 图 像 的 方法 。 接 着 介绍 了 图 像 直 方 图 概念 
与 图 像 直方 图 获取 和 显示 方法 ， 以 及 基于 图 像 直方 图 寻找 图 像 二 值 化， 利用 直方 图 实现 图 像 均 衡 化 的 原理 、 方 法 和 代码 实现 等 。 最 后 曾 述 了 利用 图 像 直方 图 数据 实现 图 像 相似 度 分 析 比较 的 三 种 方法 ， 完 成 
了 读者 对 图 像 直方 图 认 知 的 升华 。 这 些 活 生生 的 例子 让 图 像 处 理 理论 知识 贴近 项 目 应 用 ， 不 再 显得 那么 虚无 绿 绢 。 关 于 直方 图 匹配 的 话题 与 transportation problem 算 法 问题 ， 本 章 限于 篇 幅 未 能 展开 ， 强 
烈 建议 读者 在 阅读 完 本 章 内 容 以 后 进一步 去 学 习 ， 这 有 利于 强化 与 巩固 本 章 所 学 知识 。 


第 7 章 图像 编辑 


第 6 章 已 经 学 了 图 像 像素 统计 知识 与 直方 图 相关 知识 ， 本 章 将 为 读者 介绍 项 目 最 常 遇 到 的 图 像 放 缩 (resize) 、 旋 转 等 问题 的 解决 方法 。 学 完 本 章 后 ， 读 者 应 该 完全 有 能 力 驾驭 任何 语言 实现 图 像 的 放 
缩 、 旋 转 等 操作 ， 真 正 实现 对 图 像 像素 内 容 的 编辑 。 同 样本 章 内 容 也 会 涉及 一 些 最 基础 的 数学 知识 ， 但 绝对 不 会 太 多 ， 而 且 尽 量 以 直 白 ， 程 序 员 可 以 看 得 懂 的 方式 阐述 这 些 数学 知识 ， 大 家 在 学 习 本 章 内 容 
的 同时 ， 也 可 以 复习 高 中 的 数学 。 


本 章 将 会 从 图 像 像 素 采 样 开始 ， 引 入 图 像 插 值 概 念 ， 然 后 介绍 几 种 常见 的 插值 方法 ， 最 后 介绍 图 像 旋转 实现 原理 与 方法 ， 从 根本 上 帮助 读者 理解 、 认 知 这 些 原理 ， 解 决 这 些 非 常 实际 的 问题 ， 真 正 做 到 
授 人 以 渔 。 


7.1 为 什么 图 像 放 大 以 后 失真 


很 多 编程 语言 都 支持 图 像 放大 与 缩小 ， 但 很 多 时 候 图 像 放 大 以 后 就 会 很 明显 地 看 到 边缘 有 很 多 小 锯齿 ， 这 就 是 图 像 放 大 以 后 失真 最 直接 与 有 力 的 证 据 。 当 然 ， 也 有 很 多 编程 语言 支持 多 种 不 同 的 放大 方 
法 ， 可 以 通过 参数 设置 避免 放大 图 像 失 真 。 这 里 要 强调 的 是 ， 图 像 放 大 以 后 失真 是 指 图 像 明显 出 现 模 糊 ， 边 缘 有 锯齿 等 ， 而 不 是 细微 难以 观察 到 的 差别 。 


从 数字 图 像 的 本 质 来 说 ， 一 个 像素 可 以 看 成 一 个 采样 (sample) ， 一 张 图 像 就 是 由 这 许 许多 多 个 采样 (像素) 组 成 的 。 图 像 分 辨 率 从 广义 上 说 可 以 有 三 个 级 别 ， 第 一 个 是 像素 值 的 位 数 ， 常 见 的 有 32 
位 、16 位 、8 位 等 ; 第 二 个 是 图 像 空间 上 宽度 与 高 度 ; 第 三 是 显示 器 刷新 图 形 图 像 的 频率 Hz。 


图 像 放大 以 后 失真 的 主要 原因 在 于 ， 空 间 上 多 出 来 那些 新 像素 点 没有 得 到 正确 的 采样 ， 所 以 图 像 放 大 以 后 失真 可 以 看 作 图 像 采 样 的 问题 。 对 于 图 像 zoomy/resize 简 单 采 样 的 方法 可 以 分 为 三 种 ， 分 别 是 
像素 蔡 换 ， 即 Pixel replacement (临近 点 插值 ) 、 零 阶 保持 采样 、K 阶 采样 (可 以 对 图 像 任意 zoom) 。 下 面 就 来 学 习 这 三 种 放大 图 像 采样 方法 。 


1. 像 素 蔡 换 放 大 


像素 替换 放大 (Pixel replacement zooming) 与 一 种 常见 的 图 像 放 缩 方法 临近 点 插值 相似 ， 本 章 稍 后 会 进一步 介绍 临近 点 插值 算法 ， 这 里 首先 介绍 像素 替换 ， 其 对 图 像 的 放大 (zoom) 只 是 取 最 相 令 
像素 点 像素 值 作为 放大 后 的 图 像 像素 (采样 ) 。 工 作 原理 也 很 简单 ， 如 果 图 像 放 大 n 倍 ， 每 个 像素 都 会 被 蔡 换 n 次 。 假 设 图 像 宽 与 高 放大 2 倍 ， 原 来 像素 值 为 ]、2、3、4， 图 像 宽 与 高 都 为 2， 表 示 如 下 : 
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X 轴 方向 的 像素 替换 放大 2 倍 以 后 的 像素 矩阵 表示 如 下 : 


tJ 
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可 以 看 出 最 终 图 像 放 大 为 原来 的 4 倍 了 。 像 素 蔡 换 实 现 图 像 放大 的 代码 如 下 : 


int nrow (int) (row / times) ; 
int ncol (int) (col / times) ; 
int index2 = nrow * width + ncol; 
index = row * width + col; 
outPixels [index] = inPixels[index2]; 


其 中 inPixels 表 示 输 入 图 片 的 像素 数组 ，outPixels 表 示 放 大 以 后 的 像素 数组 。 
2. 零 阶 保持 放大 


零 阶 保持 放大 (Zero-order hold zooming) 图 片 也 被 称 为 双 倍 放大 ， 是 通过 间隔 插值 实现 对 图 像 放大 的 方法 ， 所 以 这 种 放大 图 像 的 方法 适合 对 图 像 实现 2n 整 数 倍 放大 。 相 对 第 一 种 方法 ， 该 方法 不 会 
产生 模糊 放大 效果 ， 它 的 基本 思想 如 下 : 选择 两 个 相 邻 的 像素 值 相 加 再 除 以 2， 然 后 将 此 值 插入 两 个 像素 之 间作 为 新 的 像素 值 ， 在 对 每 一 行 与 每 一 列 的 间隔 插值 以 后 ， 图 像 的 宽 和 高 就 各 自 放 大 了 两 倍 。 假 设 
图 像 像素 数组 2x2， 宽 高 均 为 2， 表 示 如 下 : 


对 第 一 行进 行 零 阶 保持 采样 ， (1+2) /2 = 1.5 取 整 为 1， 对 第 二 行进 行 同样 计算 取 整 为 3， 所 以 得 到 的 结果 如 下 : 


对 每 一 列 进行 零 阶 保持 技术 ， 第 一 列 (1+3) /2=2, 第 二 列 (1+3) /2=2, 第 三 列 (2+4) /2=3， 所 以 采样 放大 得 到 最 终结 果 如 下 : 
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通过 该 方法 实现 采样 放大 的 代码 如 下 : 


// for each row 

t index - 0; 

t[] rowPixels = new int[dw * height]; 

for (int row = 0; row < height; rowt-) { 
int ta = 0, tr = 0, tg=0, tb= 0; 

for (int col = 0; col < width; col++) { 
index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff; 
int pcol = col - 1; 
if (pcol < 0) 
{ 
pcol = 0; 
} 
int index2 = row * width + pcol; 
int ta2 = (inPixels[index2] >> 24) & Oxf f; 
int tr2 = (inPixels[index2] >> 16) & Oxff; 
int tg2 = (inPixels[index2] >> 8) & Oxff; 


int tb2 = inPixels[index2] & Oxff; 


int tr3 = (tr + tr2) /2; 
int tg3 = (tg + tg2) 72: 
int tb3 = (tb + tb2) /2; 
int ncol = col*2 - 1; 


if (ncol « 0) 


ncol = 0; 
} 
index = row *dw + ncol; 
rowPixels[index] = (ta << 24) 
| (tr3 << 16) | (tg3 << 8) | tb3; 
index = row * dw + col * 2; 
rowPixels[index] = (ta << 24) 
| (tr << 16 | (tg << 8) | tb; 


} 
} 
// for each column 
for (int col = 0; col < dw; col++) { 
int ta=0, tr=0, tg=0, tbh=0; 
for (int row = 0; row < height; rowt+) { 
index = row * dw + col; 
ta = (rowPixels[index] >> 24) & Oxff; 
(rowPixels[index] >> 16) & Oxff; 
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(rowPixels[index] >> 8) & Oxff; 
tb rowPixels[index] & Oxff; 
int prow = (row -1) «0? 0: (row - 1) ; 
int index2 = prow * dw + col; 
int ta2 = (rowPixels[index2] >> 24) & Oxff; 
int tr2 = (rowPixels[index2] >> 16) & Oxff; 
int tg2 = (rowPixels[index2] >> 8) & Oxff; 
int tb2 = rowPixels[index2] & Oxff; 
int tr3 = (tr + tr2) /2; 
int tg3 = (tg + tg2) /2; 
int tb3 = (tb + tb2) /2; 
int nrow = row*2 - 1; 


if (nrow « 0) 


nrow = 0; 
} 


index = nrow *dw + col; 


outPixels[index] = (ta << 24) 

| (tr3 << 16) | (tg3 << 8) | tb3; 
index = (row * 2) * dw + col; 
outPixels[index] = (ta << 24) 

| (tr << 16 | (tg << 8) | tb; 


其 中 inPixels 表 示 输 入 图 像 数 组 ，outpPixels 表 示 输 出 图 像 数组 。rowPixels 用 来 存储 行 变换 以 后 的 像素 数组 。 其 实 零 阶 保持 采样 放大 本 质 上 是 双 线 性 插值 的 变种 ， 关 于 双 线 性 插值 ， 后 面 章节 将 详细 介 
绍 ， 这 里 不 再 表述 。 


3.K 次 放大 


相 比 前 面 两 种 方法 ，K 次 放大 (K-times zooming) 更 值得 关注 ， 因 为 K 次 放大 基本 上 避免 了 像素 替换 与 零 阶 保持 的 缺点 ， 可 以 实现 任意 比例 的 放大 ， 其 中 K 表 示 放 大 因子 factor。 其 工作 步骤 大 致 可 以 
分 为 如 下 几 步 : 


1) 取 两 个 相 邻 像素 ， 两 个 像素 值 相 减 取 其 绝对 值 作为 输出 OP。 


2) 对 输出 结果 OP 除 以 放大 因子 (K) 得 到 步 长 S， 然 后 将 S 加 到 两 个 像素 中 像素 值 较 小 的 那个 ， 得 到 一 个 新 像素 值 (采样 ) ， 将 新 像素 值 插 到 上 面 提 到 的 两 个 相 邻 像素 之 间 。 继 续 对 新 得 到 相 邻 像素 像 
素 值 加 上 步 长 S， 生 成 新 的 像素 ， 直 到 新 像素 的 个 数 达 到 K-1 个 为 止 。 


3) 重复 上 述 步骤 ， 在 行 与 列 方向 即 可 得 到 放大 以 后 的 图 像 采 样 。 


假设 图 像 像素 数组 为 2x3， 即 两 行 三 列 ， 像 素数 据 数组 为 : 


行 采 样 当 K= 3 时 ， 根 据 上 面 的 第 二 步 规则 得 到 需要 插入 的 新 像素 个 数 为 2 (K-1) ， 说 明 要 在 15 与 30 之 间 插 入 两 个 采样 。 对 第 一 行 15 与 30 相 减 ， 结 果 为 15， 除 以 K 以 后 为 95， 加 上 15 与 30 中 较 小 的 像素 值 
为 15， 结 果 为 15 + 5 = 20。 则 第 一 个 采样 为 20， 第 二 采样 为 20 + 5 = 25。 同 样 对 剩 下 的 像素 进行 相似 处 理 ， 最 终 行 采样 放大 以 后 的 结果 如 下 : 


| 
Uh 


La 
LI 


15 15 

30 30 
从 上 面 可 以 看 到 当 相 邻 两 个 像素 值 第 一 个 比 第 二 个 大 时 ， 应 该 将 采样 得 到 的 结果 按照 顺序 重新 调整 为 如 下 最 终 行 采样 结果 

15 15 

30 30 


同样 对 上 面 的 行 采 样 以 后 的 结果 进行 列 采样 放大 ， 得 到 的 最 终 像素 数组 如 下 : 
= | 


基于 K 次 放大 方法 实现 行 采样 的 代码 如 下 : 


int k = (int) times; 

int dh = k * (height-1) + 1; 

int dw =k * (width-1) + 1; 

int[] outPixels = new int[dw * dh]; 

int index - 0; 

int[] rowPixels = new int[dw * height]; 


for (int row = 0; row < height; rowt+) { 
int ta = 0, tr 2-0, tg=0, tb= 0; 

for (int col = 1; col < width; col++) { 
index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 


inPixels[index] & Oxff; 
int pcol = col- 1; 

if (pcol « 0) 

{ 


pcol = 0; 

} 
int index2 = row * width + pcol; 
int ta2 = (inPixels[index2] >> 24) & Oxff; 
int tr2 = (inPixels[index2] >> 16) & Oxff; 
int tg2 = (inPixels[index2] >> 8) & Oxff; 
int tb2 = inPixels[index2] & Oxff; 
int optr - Math.abs (tr - tr2) /k; 
int optg = Math.abs (tg - tg2) /k; 
int optb = Math.abs (tb - tb2) /k; 

JE 


(int t-1; t«k; t++) 


int ncol = col*k - (k-t) ; 
if (ncol « 0) 


ncol = 0; 
} 
index = row *dw + ncol; 
int tr3 = Math.min (tr, tr2) +t * op 
int tg3 = Math.min (tg, tg2) + t * optg; 
+ op 


int tb3 = Math.min (tb, tb2) th; 
rowPixels[index] = (ta << 24) 
| (tr3 << 16) | (tg3 << 8) tb3; 
} 
index = row * dw + col * k; 
rowPixels[index] = (ta << 24) 
(tr << 16) | (tg << 8) | tb; 


index = row * dw + (col * k) - k; 
rowPixels[index] = (ta << 24) 
| (tr2 << 16) | (tg2 << 8) | tb2; 


继续 上 述 代 码 ， 实 现 列 采样 的 代码 如 下 : 


// for each column 


for 


(int col 


—0; col < dw; 


colt) 


int 
for 


ta 
tr 
tg 
tb 
int 
in 


ta = 0, 
(int row = 1; 
index = row * dw + col; 
(rowPixels [index] 
(rowPixels [index] 
(rowPixels [index] >> 8) & Oxff; 
rowPixels[index] & Oxff; 
prow = 
index2 = prow * dw + col; 


tr = 0; 


(row -1) 


in 


La 


2 = (rowPixel 


tg = 0, 
row < height; 


«0? 


s[index2 


>> 24) 
>> 16) 


{ 


tb = 0; 


rowt+) { 


& Oxff; 
& Oxff; 


5 


0 : (row - 1) ; 


» 


>> 24) & Oxff; 


CI 


2 = (rowPixe] 


s [index2 


] 
] >> 16) 


& Oxff; 


in 


tg2 = 


in 


(rowPixels[index2] >> 8) & Oxff; 


tb2 = rowPixels [index2] 


op 


tr — Math.abs 


op 


tg — Math.abs 


index = 


int 


Op 


(int t=1; 


in 
if 
{ 


} 


tb = Math.abs 
t<k; 


(nrow < 0) 


nrow = 0; 


t nrow = row*k - 


(tr = 
ptg = 
(tb - 
t++) 


index = nrow *dw + col; 


in 


in 


Tn 
ou 


| (tr3 


(row * k) 


outPixels[index] - 


index = 


(row * k - 


outPixels[index] - 


| (tr2 «« 1 


& Oxff; 
tr2) /k; 

tg2) /k; 
tb2) /k; 


(kt); 


t tr3 = Math.min (tr, 


t tg3 = Math.min (tg, 
t tb3 = Math.min (tb, 
tPixels [index] 


= (ta 
<< 16) | 


<< 24) 


(tg3 << 8) 


* dw + col; 


(tg 
k) * dw 


6) | 


(ta «« 24 
| (tr << 16) 


(ta «« 24 
(tg2 «« 8) 


) 
«« 8) | 
+- COL; 

) 
| tb2; 


笔者 已 经 把 三 种 图 像 放 大 的 方法 封装 为 类 ZoomFilterjava， 调 用 该 类 实现 图 像 放 大 的 测试 ， 只 需要 在 ImagePanel 的 process () 方法 中 添加 如 下 几 行 代码 即 可 : 


ZoomFilter 


filter - 


ilter.setType (ZoomFil 
ilter.setTimes (3) ; 


运行 MainU1， 选 择 一 张 图 片 ， 单 击 【 处 理 】 按 钮 即 可 查看 效果 ， 可 以 看 到 图 像 放大 以 后 有 很 明显 的 边缘 饥 齿 与 模糊 ， 人 在 本 章 的 下 面 内 容 将 着 力 解决 这 一 问题 。 


Qua 如 果 没 有 特别 说 明 ， 所 有 算法 类 的 测试 都 放 在 ImagePanel.java 的 btocess 方 法 中 ， 然 后 运行 MainUI.java， 选 择 一 张 图 片 之 后 ， 单 击 【 处 理 】 按 钮 查看 运行 


明 。 


7.2 | 


1. 揪 值 原理 


本 节 重 点 介绍 一 种 简单 易 用 的 图 像 插值 算法 


tImage = 


Filter.filter (s 


mL Sz 


ource] 


[mage, 


new ZoomFilter () ; 
ter.K TIMES ZOOM) ; 


null) ; 


临近 点 插值 算法 。 插 值 原理 就 是 寻找 离 目标 像素 最 近 的 源 像素 值 ， 可 以 很 形象 地 表示 为 图 7-1。 


效果 ， 


其 中 的 X 表 示 目 标 图 像 需要 插值 的 像素 点 D (x, y) ， 根 据 临 近 点 插值 原则 ， 它 距离 P (1, 0) 像素 最 近 ， 所 以 就 用 P (1, 0) 的 像素 值 作为 D (x, y) 的 值 。 根 据 图 7-1 可 知 ， 当 一 幅 二 维 数字 图 像 从 源 
图 像 NxM 被 放 为 jxN) * (kxM) 目标 图 像 时 ， 参 照 数学 斜率 计算 公式 必然 有 : 


(X; idi Ania CA aia = Assn) = (Y dis Y aisi d E F) 


当 Xmin 和 Ymin 均 为 从 零 开 始 的 像素 点 时 ， 公 式 可 以 简化 为 : X=Y1 (Xmax/Ymax) 
对 于 任意 一 幅 源 图 像 来 说 ， 假 设 放大 后 目标 图 像 的 宽 为 Dw， 高 为 Dh， 任 意 目标 像素 点 (Du, Dy) 在 源 图 像 上 的 位 置 为 : 


h ID hb) // TOW 


// column 
et Ox, Sy); 


其 中 ， (Sy Sy) 为 对 于 的 源 图 像 上 的 像素 点 ，Sw 和 Sh 分 别 为 源 图 像 的 宽度 和 高 度 。 最 终 有 : 


人 


2. 实 现 步骤 与 代码 解析 


a 


实现 临近 点 插值 首先 要 根据 源 图 像 与 目标 图 像 的 宽度 与 高 度 计算 图 像 放 缩 比例 ， 然 后 根据 目标 图 像 像素 点 位 置 ， 寻 找 其 在 源 图 像 中 的 最 近邻 像素 ， 将 该 像素 赋值 给 目标 像素 点 。 对 目标 像素 所 有 像素 点 


完成 上 述 操作 即 实现 了 图 像 | 


告 近 点 插值 放 缩 。 


计算 放 缩 比例 的 代码 如 下 : 


loat rowRatio = 


float) height) / ( (float) destH) ; 


loat colRatio - 


( 
( 


一 一 、 


float) width) / ( (float) destW) ; 


根据 目标 像素 点 位 置 计算 源 像素 点 位 置 的 代码 如 下 : 


int srcRow = Math.round ( ( (float) row) *rowRatio) ; 


if (srcRow »-height) { 
srcRow = height - 1; 
} 


// find the column index of source pixe 


1 


int srcCol = Math.round ( ( (float) col) 
if (srcCol >= width) (| 
srcCol = width - 1; 


} 


像素 赋值 的 代码 如 下 : 


outPixels[index2] = inPixels[index]; 


其 中 outPixels 表 示 输 出 像素 数组 ，inPixels 表 示 源 图 像 像素 数组 。 完 整 的 基于 | 


package com.book.chapter.seven; 
import java.awt.image.BufferedImage; 
import java.awt.image.ColorModel; 


*colRatio) ; 


import com.book.chapter.four.AbstractBuf 


feredImageOp; 


public class NearestZoomFilter extends AbstractBufferedImageOp { 


private int destH; // zoom height 
private int destW; // zoom width 
public NearestZoomFilter () 


i 


System.out.println ("Nearest Pixel Interpolation") ; 


} 


public void setDestHeight (int destH) { 


this.destH = destH; 


wein 


} 


public void setDestWidth (int destW) { 


this.destW = destw; 


} 


@Override 


public BufferedImage filter (BufferedImage src, 


BufferedImage dest) { 


int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[destH * destW]; 


getRGB (src, 0, 0, width, height, inPixels) ; 


oat rowRatio = ( (float) heig 
loat colRatio = ( (float) widt 
int index - 0; 
for (int row = 0; row < destH; 
int srcRow = Math.round ( 
( (float) row) *rowRatio) ; 
if (srcRow »-height) { 
srcRow = height - 1; 


int srcCol = Math.round 


ht) / ( (float) destH) ; 
h) / ( (float) destW) ; 


rowt+) { 


for (int col = 0; col < destW; col++) { 


( 


( (float) col) *colRatio) ; 


H- 


f (srcCol >= width) 


{ 


srcCol = 


width - 1; 


} 


int index2 = row * destW + col; 
index = srcRow * width + srcCol; 


outPixels[index2] = inPixels [index] ; 


} 


H 
[0] 
C-ct 


turn dest; 


tRGB (dest, 0, 0, destW, destH, outPixels) ; 


public BufferedImage createCompatibleDestImage ( 


if ( dstCM -- null ) 
dstCM - src.getColorModel () 
return new BufferedImage (dstCM, 


BufferedImage src, ColorModel dstCM) { 


> 


dstCM. createCompatibleWritableRaster (destW,  destH) , 


dstCM.isAlphaPremultiplied () , 


EHrhgg& T createCompatibleDestlmage () 方法 目的 是 创建 一 个 放大 以 后 的 Bufferedlmage 对 象 。 调 用 NearestZoomFilter 实 现 图 像 放 大 ， 同 样 


null) ; 


鱼 近 点 插值 实现 图 像 放大 的 类 代码 如 下 : 


代码 以 后 ， 运 行 MainUl.java 选 择 需要 的 放大 的 图 片 ， 单 击 【 处 理 】 按 钮 即 可 查看 效果 。 需 要 添加 的 代码 如 下 : 


NearestZoomFilter filter = new NearestZoomFilter () ; 


destImage = filter.filter (sourceImage, 


7.3. XXEXUERSIBIEUA 


1. 揪 值 原理 


本 节 将 介绍 一 种 反 饥 齿 的 图 像 插值 算法 


ilter.setDestHeight (sourcelmage.getHeight () * 2) ; 
ilter.setDestWidth (sourceImage.getWidth () * 2) ; 


null) ; 


告 近 点 插值 是 一 种 快速 放大 的 方法 ， 不 足 之 处 是 基于 该 方法 产生 图 像 有 明显 的 锯齿 和 模糊 ， 不 是 一 种 很 好 的 插值 算法 。 


Em 
只 再 


要 在 lImagePanel 的 process 方 法 添加 几 行 简单 


双 线 性 插值 ， 该 方法 基于 对 插值 像素 周围 四 个 源 像素 点 值 与 之 距离 权重 作为 考量 依据 从 而 计算 得 到 插值 像素 点 的 像素 值 。 可 以 将 其 形象 地 表示 为 图 7-2。 


P (n,m) P (n, m+1) 


fT n+l 


P (n1, m) P (n+l, m1) 


tm Jm] 


图 7-2” 双 线性 插值 示意 图 


HED (t, u) 表示 采样 点 的 小 数 部 分 坐标 ， 矩 形 四 个 角 点 分 别 表示 四 个 像素 点 P (n, m), P (n+1, m), P (n, m+1) , P (n«1, m+1) 。 从 图 7-2 中 可 以 看 出 ,采样 点 D 水 平方 向 距离 
P (n, m) 5P (n+1, m) 的 距离 为 U， 则 距离 P (n，m+1) SP (n+1, m+1) 的 距离 可 以 表示 为 1-u， 通 常情 况 下 ， 距 离 越 远 则 权重 越 小 ， 距 离 越 近 意味 着 对 采样 像素 贡献 越 大 ， 权 重 也 应 该 越 大 ， 所 
以 当 距 离 为 u 时 ， 对 应 权重 应 为 1-u。 由 此 可 以 得 到 两 个 水 平方 向 权重 像素 : 


Di (1-u)X P(n, m) T uX P(n, m T 1) 
T (1-u) X P(n-1, m) + uXP(n + 1,m + 1) 


根据 T1、T2 值 与 垂直 方向 的 权重 系数 u 和 1-uU， 可 以 得 到 最 终 采 样 像素 值 : 


将 T1 与 12 带 入 ， 最 终 得 到 如 下 : 
D(x, y) = P(n, m) X (1-4) X (1-u) + P(n, mt 1)XuX (1-4) + P(n + 1,m) 
X (1-u) Xt P(n + l,m + l)yXtXu 


根据 该 公式 即 可 计算 出 目标 采样 像素 值 。 根 据 双 线性 插值 的 基本 原理 ， 程 序 实现 双 线 性 插值 可 以 分 为 如 下 几 步 : 


1) 获取 源 图 像 像素 数组 ， 根 据 放 缩 比率 获得 目标 图 像 的 宽 与 高 。 


2) 循环 目标 图 像 上 的 每 个 像素 ， 根 据 坐 标 寻 找 其 在 源 图 像 中 的 四 个 相 邻 像素 。 


3) 根据 小 数 部 分 坐标 计算 得 到 的 像素 值 即 为 目标 图 像 像素 值 。 


2. 编 码 实现 


计算 放 缩 比率 的 代码 如 下 : 


Rati 
Rati 


t row] 
t coll 


loa 
loa 


float) height) / ( (float) destH) ; 
float) width) / ( (float) destW) ; 


根据 比例 计算 目标 像素 Y 方 向 整数 与 小 数 坐 标的 代码 如 下 : 


double srcRow = 


( (float) row) *rowRatio; 


// 获取 整数 部 分 坐标 row Index 
double j = Math.floor (srcRow) ; 
// 获取 行 的 小 数 部 分 坐标 

double t = srcRow - j; 


计算 X 方 向 整数 与 小 数 坐 标的 代码 如 下 : 


double srcCol = 
// 获取 整数 部 分 坐标 column Index 
double k = Math.floor (srcCol) ; 
// 获取 列 的 小 数 部 分 坐标 


double u srcCol - k; 


( (float) col) *colRatio; 


根据 坐标 在 源 像素 数组 中 获取 四 个 相 邻 像素 点 的 代码 如 下 : 


int[] pl = getPixel (j, k, width, height, inPixels) ; 
int[] p2 = getPixel (j, k+l, width, height, inPixels) ; 
int[] p3 = getPixel (j+1, k, width, height, inPixels) ; 
int[] p4 = getPixel (j41, k+l, width, height, inPixels) ; 


根据 公式 计算 得 到 目标 像素 值 的 代码 如 下 : 


double a = (1.0d-t) * (1.0d-u) ; 

double b = (1.0d-t) *u; 

double c = (t) * (1.0d-u) ; 

double d = t*u; 

ta = 255; 

tr = (int) (pl[0] * a + p2[0] * b + p3[0] 
tg = (int) (p 

th = (int) (p 


ee + p40) * d); 
1[1] * a+ p2[1] * b + p3[1] * c + p4[1] * d) ; 
1[2] * a+ p2[2] * b + p312] * e + p4[2] * QD ; 


实现 双 线 性 插值 完整 的 代码 如 下 : 


package com.book.chapter.seven; 


import java.awt.image.BufferedImage; 
import java.awt.image.ColorModel; 
import com.book.chapter.four.AbstractBufferedImageOp; 
public class BilinearZoomFilter extends AbstractBufferedImageOp { 
private int destH; // zoom height 
private int destW; // zoom width 
public BilinearZoomFilter () 
{ 
} 
public void setDestHeight (int destH) { 
this.destH = destH; 
} 
public void setDestWidth (int destW) { 
this.destW = destw; 
} 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[destH * destW]; 
getRGB (src, 0, 0, width, height, inPixels) ; 
float rowRatio = ( (float) height) / ( (float) destH) ; 
float colRatio = ( (float) width) / ( (float) destW) ; 
int index = 0; 
for (int row-0; row«destH; row--) { 
int ta = 0, tr=0, tg=0, tb= 0; 
double srcRow = ( (float) row) *rowRatio; 
// 获取 整数 部 分 坐标 row Index 
double j = Math.floor (srcRow) ; 
// 获取 行 的 小 数 部 分 坐标 
double t = srcRow - j; 
for (int col=0; col«destW; col++) { 
double srcCol = ( (float) col) *colRatio; 
// 获取 整数 部 分 坐标 column Index 
double k = Math.floor (srcCol) ; 
// 获取 列 的 小 数 部 分 坐标 
double u = srcCol - k; 
int[] pl = getPixel (j, k, width, height, inPixels) ; 
int[] p2 = getPixel (j, k+l, width, height, inPixels) ; 
int[] p3 = getPixel (j41, k, width, height, inPixels) ; 
int[] p4 = getPixel (j41, k+1, width, height, inPixels) ; 
double a = (1.0d-t) * (1.0d-u) ; 
double b = (1.0d-t) *u; 
double c = (t) * (1.0d-u) ; 
double d = t*u; 
ta = 255; 
tr = (int) (pl[0] * a + p2[0] * b + p3[0] c + p4[0] * d) ; 
tg = (int) (pl[1] * a+ p2[1] * b + p3[1] * c + p4[1] * d) ; 
tb = (int) (pl[2] * a + p2[2] * b + p3[2] * c + p4[2] * d) ; 
index = row * destW + col; 
outPixels[index] = (ta << 24) 
| (clamp (tr) << 16) | (clamp (tg) << 8) | clamp (tb) ; 
} 
} 
setRGB (dest, 0, 0, destW, destH, outPixels) ; 
return dest; 
} 
private int[] getPixel (double j, double k, 
int width, 
int height, 
int[] inPixels) { 
int row — (int) j; 
int col = (int) k; 
if (row >= height) 


row 


height = 1; 


(row < 0) 


row = 0; 


f (col « 0) 


a H- ~ 一 


col = 0; 


} 

if (col >= width) 

{ 

col = width - 1; 


int index = row * width + col; 


int[] rgb = new int[3]; 

rgb[0] = (inPixels[index] >> 16) & Oxff; 
rgb[1] = (inPixels[index] >> 8) & Oxff; 
rgb[2] = inPixels[index] & Oxff; 

return rgb; 


public BufferedImage createCompatibleDestImage ( 
BufferedImage src, ColorModel dstCM) { 

if ( dstCM = null ) 

dstCM = src.getColorModel 

return new BufferedImage (dstCM, 
dstCM.createCompatibleWritableRaster ( 

destW, destH) , 

dstCM.isAlphaPremultiplied () , null) ; 


“oN 
Ww 


运行 与 测试 BilinearZoomFilter， 只 需要 在 ImagePanel 的 process 方 法 中 添加 如 下 几 行 代码 : 


BilinearZoomFilter filter = new BilinearZoomFilter () ; 
filter.setDestHeight (sourceImage.getHeight () * 2) ; 
filter.setDestWidth (sourceImage.getWidth () * 2) ; 
destImage = filter.filter (sourceImage, null) ; 


然后 在 eclipse 中 运行 MainUljava， 选 择 一 张 图 像 单 击 【 处 理 】 按 钮 即 可 查看 效果 。 
3. 双 线性 插值 优 缺 点 


双 线 性 内 插值 算法 在 图 像 的 放 缩 处 理 中 具有 抗 锯齿 功能 ， 是 最 简单 和 常见 的 图 像 放 缩 算法 ， 但 是 双 线 性 内 插值 算法 没有 考虑 边缘 和 图 像 的 梯度 变化 ， 相 比 之 下 ， 双 立方 插值 算法 可 以 更 好 地 解决 这 些 问 
题 。 下 面 一 节 介 绍 双 立 方 插值 的 相关 知识 。 


7.4” 双 立方 插值 与 Lanczos 采 术 


本 节 介绍 两 种 经 典 的 图 像 插值 算法 


4 双 立 方 插值 算法 与 Lanczos 采 样 插值 算法 ， 相 比 之 前 介绍 的 插值 算法 ， 这 两 种 插值 算法 计算 量 更 大 ， 插 值 效 果 也 更 好 ， 在 许多 图 像 处 理 软件 中 被 广泛 应 用 ， 因 此 
更 具 工 程 实践 性 与 重要 性 。 
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图 像 旋转 也 是 实际 项 目 中 经 常 遇 到 的 问题 ， 几 乎 所 有 主流 的 编程 语言 都 支持 通过 API 实 现 图 像 错 切 与 旋转 ， 本 节 将 从 图 像 旋转 的 基本 原理 、 涉 及 问题 、 快 速 方法 等 几 个 方面 来 介绍 图 像 旋转 算法 的 编程 实 
践 。 通 过 本 节 知 识 学 习 ， 读 者 可 以 轻松 实现 图 像 的 错 切 与 旋转 ， 不 再 对 此 有 任何 认 知 上 的 盲点 与 难点 。 本 节 首 先 介绍 一 种 通过 中 心 极 坐标 变换 双 线 性 插值 实现 图 像 旋转 的 算法 ， 然 后 介绍 通过 错 切 实现 图 像 
旋转 的 算法 。 此 外 ， 还 会 涉及 一 些 简单 而 且 基 础 的 数学 知识 。 


1. 基 于 线性 插值 的 旋转 方法 


基于 线性 插值 的 图 像 旋 转 方法 是 一 种 采样 插值 图 像 旋转 方法 ， 当 把 图 像 的 像素 二 维 数组 看 成 一 个 矩阵 时 ， 这 里 假设 旋转 都 是 围绕 图 像 的 中 心 点 进行 的 ， 轴 旋转 角度 为 ， 这 样 旋转 点 与 旋转 角度 就 是 已 知 
值 了 ， 通 过 反 三 角 函 数 计算 像素 各 点 距离 中 心 点 的 距离 r， 然 后 根据 反 三 角 函 数 与 极 坐 标 相关 知识 就 可 以 通过 旋转 以 后 的 图 像 像素 坐标 计算 得 到 源 像素 中 四 个 最 近 像 素 点 ， 从 而 实现 双 线 性 插值 ， 得 到 旋转 以 
后 的 图 像 像素 点 ， 最 终 完 成 图 像 旋转 。 二 维 的 和 矩阵 旋转 公式 如 下 : 


COS G — sit 


on 1 


假设 源 像素 点 P 坐 标 为 (x1, y1) ， 旋 转 中 心 点 C 坐 标 为 (x0，y0) ， 则 旋转 角度 以 后 得 到 的 P 点 坐标 为 : 


cos( O) x Lx, 
sin( O) x (x, 


sin( 0) x (v, 


X4) + cos(0) x (y, 


^p / Yo) + Xo 


Yo ) ** Vo 


坐标 P 旋 转 以 后 的 新 位 置 为 (x2，y2) 。 根 据 上 述 公 式 完成 旋转 以 后 的 图 片 与 原 图 相 比 不 是 很 清晰 ， 其 主要 原因 在 于 没有 考虑 图 像 新 位 置 的 小 数 部 分 对 图 像 像素 的 影响 ， 而 基于 双 线 性 插值 旋转 正好 解决 了 旋 
转 中 的 这 个 问题 ， 从 而 得 到 质量 较 高 的 旋转 图 片 。 前 面 计算 双 线 性 插值 时 ， 我 们 通过 目标 像素 反 向 寻找 了 源 像素 ， 这 里 也 是 一 样 ， 假 设 旋转 以 后 的 像素 点 P (x，y) 旋转 角度 为 6， 根据 像素 点 P 到 中 心 点 的 


欧 几 里 得 距离 "与 角度 8， 


本 原理 介绍 到 这 里 结束 。 


最 终 得 到 源 像 素 点 小 数 与 整数 坐标 ， 然 后 使 用 双 线 性 插值 算法 得 到 像素 值 赋 给 旋转 以 后 的 像素 点 P。 对 旋转 以 后 的 每 个 像素 点 都 做 这 样 的 处 理 ， 就 可 完成 图 像 的 双 线 性 插值 旋转 ， 基 


下 面 来 剖析 实现 双 线 性 插值 旋转 编码 过 程 中 的 四 个 细节 问题 ， 首 先是 特殊 角度 旋转 编码 的 实现 ， 其 次 是 如 何 通过 旋转 后 的 坐标 寻找 源 像素 中 的 对 应 像素 点 坐标 ， 然 后 是 双 线 性 插值 得 到 像素 值 的 方法 ， 


最 后 是 旋转 以 后 非 图 像 内 容 像素 ( 


(1) 特殊 角度 旋转 


a6 
FER 


当 角 度 为 90*180*、270°? 时 ， 代 码 如 下 : 


inl 
inl 


index = 0; 
index2 = 0; 


tw — height; 
th = width; 


if (specialAngle 


f (specialAngle == 90) 


tw 
th 


width; 
height; 


if (specialAngle 


row=0; 


height; 
width; 


180) 


270) 


tPixels = new int [wid 
row<height; 


{ 


int ta = 0, 


tr = 


ta 
tr 


for (int col=0; 
index = row * width + 
Ls [index] 
s [index] 


(inPixe] 
(inPixe] 


0, 


H 
"me 


index2 = out 


} 


else if (special 


{ 


(inPixe] 
inPixels[index] 
specialAngle == 90) 


Ls [index] 


tg = 0, 
col<width; 


& Ox 


tw * col + 


th * height]; 
rowt++) 


tb = 0; 
col++) 


col; 
>> 24) 
>> 16) 
>> 8 


& Oxf 
& Oxf 
Oxf f; 


& 


{ 


BA) 颜色 填充 。 


(height - 1- row) ; 


Angle == 180) 


index2 - outw * 


} 


else if (special 


{ 


(height - 1 - row) 
(width - 1 - col) 


Angle == 270) 


index2 = outw * 


} 


outPixels [index2 ] 


} 


(tr < 


< 16) 


tRGB ( dest, 
turn dest; 


fferedimage dest = crea 
0, 


0, 


(2) 源 像素 坐标 计算 


当 旋转 角度 不 是 特殊 角度 时 就 需要 计算 源 像素 坐标 ， 通 过 反 三 角 函 数 知识 与 极 坐 标 知识 实现 源 像素 坐标 计算 。 


int) 


— (in 
= (int) 


OULW 


(width - 1 - col) 


>» 


+ 


(ta << 24) 


> 


(tg << 8) | 1 


outh, 


teCompatibleDest] 


[mage ( src, 
outPixels ) ; 


null.) 


(width*Math.cos (angle) +height*Math.sin (angle) ) ; 
(height*Math.cos (angle) +width*Math.sin (angle) ) ; 


其 次 需要 计算 源 图 像 与 旋转 后 图 像 旋转 中 心 位 置 ， 代 码 片 段 如 下 : 


rd 


+ 


// calculate new center coo 
float centerX = outw / 2.0f 
loat centerY = outh /2.0f 

// calculate the original cen 
Float ocenterX = width / 2.0f 
float ocenterY = height /2.0f + 


ina 


- 0. 
QT: 


ter 


F 0.5 


0 


te 
5f; 


b 


coordinate 


Sa 


eds 


首先 要 根据 源 图 像 宽 与 高 计算 目标 图 像 宽 与 高 ， 代 码 如 下 : 


然后 计算 旋转 后 图 像 像素 点 到 中 心 点 的 距离 ， 且 根据 距离 计算 与 源 像素 点 之 间 的 角度 ， 


代码 片段 如 下 : 


(double) rx) ; 


rx — col - centerX; 
ry — centerY - row; 
float fDistance = (float) Math.sqrt (rx * rx + ry * ry) ; 
Float fPolarAngle = 0; M 
if (rx |! 20) { 
fPolarAngle = (float) Math.atan2 ( (double) ry, 
} else { 
if (rx == 0) | 
if (ry == 0) | 
outPixels[index] = centerPixel; 
continue; 


} 


else if (ry < 0) { 


fPolarAngle = 1.5f * (f 
) else ( 
fPolarAngle = 0.5f * (f 


} 


其 中 rx= =0 或 ry= =0 表 示 特 殊 角度 ， 


// "reverse" rotate, 


fPolarAngle -= angle; 


loa 


loa 


t) Ma 


Lh. PIS 


t) Ma 


Lh. PI: 


已 经 处 理 。 最 后 根据 角度 集合 三 角 遂 数 知识 得 到 源 像素 点 坐标 ， 代 码 片 段 如 下 : 


so minus instead of plus 


px = fDistance * (float) Math.cos (fPolarAngle) ; 
py = fDistance * (float) Math.sin (fPolarAngle) ; 
// get original pixel float point 
prow ( (float) ocenterY) - py; 
pcol ( (float) ocenterX) + px; 


(3) 双 线 性 插值 


根据 上 面 获得 的 浮 点 数 坐 标 ， 实 现 双 线性 插值 ， 代 码 片 段 如 下 : 


private int[] bilineInterpolation (int[] input, 

int width, int height, 

float prow, float pcol) { 

double row = Math.floor (prow) ; 

double col - Math.floor (pcol) ; 

if (row < 0 || row >= height) { 
return new int[] {background.getRed () , 
background.getGreen () , background.getBlue () }; 


pu. c 


f (col < 0 || col >= width) { 
return new int[] {background.getRed () , 
background.getGreen () , background.getBlue () }; 


} 


int rowNext = (int) row + 1, colNext = (int) col + 1; 
if ( (row + 1) >= height) | 
rowNext = (int) row; 


if ( (col + 1) >= width) { 


colNext = (int) col; 

} 

double t = prow - row; 

double u = pcol - col; 

double coffiecentl = (1.0d-t) * (1.0d-u) ; 

double coffiecent2 = (t) * (1.0d-u) ; 

double coffiecent3 = t*u; 

double coffiecent4 = (1.0d-t) *u; 

int indexl = (int) (row * width + col) ; 

int index2 = (int) (row * width + col lNext) ; 

int index3 = (int) (rowNext * width + col) ; 

int index4 = (int) (rowNext * width + col lNext) ; 

int- tris tr2> r3, r4: 

int tgl, tg2, tg3, tg4; 

int tbl, tb2, tb3, tb4; 

trl = (input[index1] >> 16) & Oxff; 

tgl = (input[index1] >> 8) & Oxff; 

tbl = input[index1] & Oxff; 

tr2 = (input[index2] >> 16) & Oxff; 

tg2 = (input[index2] >> 8) & Oxff; 

tb2 = input[index2] & Oxff; 

tr3 = (input[index3] >> 16) & Oxff; 

tg3 = (input[index3] >> 8) & Oxff; 

tb3 = input[index3] & Oxff; 

tr4 = (input[index4] >> 16) & Oxff; 

tg4 = (input[index4] >> 8) & Oxff; 

tb4 = input[index4] & Oxff; 

int tr = (int) (trl * coffiecentl + tr2 * coffiecent4 
+ tr3 * coffiecent2 + tr4 * coffiecent3) ; 

int tg = (int) (tgl * coffiecentl + tg2 * coffiecent4 
+ tg3 * coffiecent2 + tg4 * coffiecent3) ; 

int tb = (int) (tbl * coffiecentl + tb2 * coffiecent4 
+ tb3 * coffiecent2 + tb4 * coffiecent3) ; 

return new int[]{tr, tg, tb); 


(4) 背景 像素 颜色 


旋转 以 后 的 图 像 比 原 图 像 相 比 ， 往 往 宽 与 高 都 会 增加 而 产生 一 些 额 外 背景 像素 ， 对 此 这 里 采用 黑色 作为 默认 背景 颜色 填充 。 这 部 分 代码 如 下 : 


pis 


f (row < 0 || row >= height) { 
return new int[] {background.getRed () , 
background.getGreen () , background.getBlue () }; 


E 


f (col < 0 || col >= width) { 
return new int[] {background.getRed () , 
background.getGreen () , background.getBlue () }; 


其 中 background 为 Java 中 的 java.awt.Color 类 实例 。 


Su 


完整 的 双 线 性 插值 旋转 代码 可 以 参考 源 文 件 的 类 BiLineRotateFilterjava， 程 序 通过 参数 设置 已 经 实现 了 0"~360" 的 任意 角度 旋转 ， 同 时 还 提供 了 设置 不 同 背 景 颜色 的 参数 ， 感 兴趣 的 读者 可 以 进一步 修 
改 使 用 该 类 。 通 过 MainUl 运 行 测试 BiLineRotateFilter 类 时 ， 只 需要 在 ImagePanel 类 的 process () 方法 中 添加 如 下 几 行 代码 即 可 : 


BiLineRotateFilter filter = new BiLineRotateFilter () ; 
filter.setDegree (58) 
destImage = filter.filter (sourceImage, null) ; 


we 


2. 基 于 错 切 变换 的 旋转 方法 


在 旋转 角度 较 小 的 情况 下 ， 旋 转 矩 阵 可 以 通过 两 次 错 切 变换 得 到 旋转 以 后 的 图 片 ， 在 角度 较 大 的 情况 下 ， 通 过 三 次 错 切 变换 得 到 旋转 以 后 的 图 片 。 角 度 较 小 是 指 旋转 角度 6 小 于 15"， 角 度 较 大 是 指 旋转 
角度 小 于 90"。 对 于 旋转 角度 大 于 90" 的 ， 可 以 先 旋转 特殊 角度 ， 最 后 错 切 旋转 。 旋 转 矩 阵 等 价 于 三 次 错 切 变 换 的 等 式 如 下 : 


Ct Ck 
] = 


COR Q — sin a lan 一 一 | () | 一 [an P 


sin a COS (y sing | 


0 | ( | 


其 中 表示 旋转 角度 。 图 7-4 是 将 一 个 和 矩形 通过 三 次 错 切 旋转 45" 的 各 个 步骤 实现 图 。 


通过 三 次 错 切 实现 图 像 旋转 ， 在 编码 时 需要 考虑 的 细节 问题 有 很 多 ， 首 先 由 于 错 切 计 算 采 用 正切 三 角 函 数 ， 其 角度 的 取 值 范围 为 | - 273 21, 对 于 角度 大 于 90" 的 旋转 ， 先 变换 特殊 角度 (2090°, 180". 
每 次 错 切 变换 之 后 的 图 像 宽 与 高 ， 以 及 实际 像素 匹配 问题 是 一 个 非常 难 的 编程 点 。 最 后 采用 临近 


270°) , 


实现 错 切 之 后 各 个 像素 点 的 像素 计算 是 一 个 重要 的 编程 技巧 。 


TH VJ X — shear 


然后 将 剩余 角度 通过 三 次 错 切 实现 。 在 


1) 获取 源 图 像 像素 ， 宽 与 高 。 


2) 计算 第 一 次 


3) 根据 第 二 步 结果 ， 


计算 Y-shear 错 切 变换 之 后 的 图 像 宽 与 高 。 


在 错 切 变换 过 程 中 ， 图 像 的 大 小 会 发 生 形 变 ， 计 算 


通过 三 次 


错 切 实现 图 像 旋转 程序 步骤 


错 切 X-shear 之 后 的 图 像 宽 与 高 ， 实 现 X 方 向 错 切 变换 。 


4) 根据 offsetY 与 错 切 之 后 图 像 的 实际 高 度 ， 实 现 源 像素 值 坐标 插值 计算 。 


5) 完成 Y-shear， 使 用 临近 


6) 根据 第 二 次 错 切 Y-shear 结 果 ， 


计算 最 终 旋转 之 后 图 像 的 宽 


点 插值 计算 各 个 像素 点 值 。 


与 高 度 。 


7) 根据 X 方 向 的 offsetX 与 错 切 之 后 图 像 实际 宽 与 高 ， 实 现 源 像素 值 坐标 查找 计算 。 


8) 使 用 临近 


点 插值 计算 


程序 实现 关键 代码 解析 


计算 第 一 次 


double angleValue = 


out 
Out 


计算 第 二 次 


angleValue = 
w — width; 
(int) 


out 
th = 


ou 


h = height; 
w= (int) 


in 


L ou 


thh = 


(int) 


in 


t of 


( (angle/2.0d) /180.0d) 


( (angle) /180.0d) 
/ 


/ big trick! ! ! ! 


* Math.PIl; 


? 


最 终 旋 转 之 后 的 图 像 各 个 像素 值 。 


错 切 X-shear 之 后 图 像 的 宽 与 高 的 代码 片段 如 下 : 


* Math.PI; 


(width + height * Math.tan (angleValue) ) ; 


错 切 Y-shear 之 后 图 像 的 宽 与 高 的 代码 片段 如 下 : 


(srcWidth * Math.sin (angleValue) 

* height * Math.cos (angleValue) ) ; 
(srcWidth * Math.sin (angleValue) 
FsetY = outhh - outh; 


计算 第 三 次 错 切 X-shear 之 后 图 像 的 宽 与 高 的 代码 片段 如 下 : 


+ height) ; 


ee TY — shear 


又 归纳 如 下 : 


FU] X — shear 


点 插值 算 


法 


angleValue = 

double fullAngleValue = 
outh = height; 

outw = (int) 

int outww = (int) 
double offsetX = Math. 


( (angle/2.0d) /180.0d) 
( (angle) /180.0d) 

// big trick 
(srcWidth * Math.cos (f 


* Math.PI; 


* Math.PI; 


ullAngleValue) 
- srcHeight * Math.sin (fullAngleValue) ) ; 


(width + height * Math.tan (angleValue) ) ; 


floor ( (outww - outw) /2.0d + 0.5d) ; 


基于 像素 小 数 坐标 的 像素 临近 


private int[] getNearestPixels (int[] input, 


doubl 
doubl 
if (row < 0 || row 
return new int[] 
backgroundCol] 
backgroundCol] 


pu. c 


£ (col 


double prow, 


double pcol, 


e row = Ma 


th.f 


oor (prow) ; 


e col = Ma 


double u = yshear ? 


return new 


«0 || col 
int 
backgroundCol 
backgroundCol] 


th. 


>= height) 


Floor (pcol ) : 


lor.ge! 


点 插值 的 代码 片段 如 下 : 


int width, 


boolean yshear) { 


2 


>= width) 


or.ge 


{ 


int 


nextRow = 


(in 


t) (row + ] 


int 


LE 


3E 


int 


nextCol = 
(col + 1) 


t) (col + 
width) { 


nextCol = 


(row + 1) 


t) col; 


height) { 


nextRow = 


indexl = yshear? (int) 
(row * width + col 


(int) 


(int) 


trl, tr2; 


t index2 = yshear? 
(row * width 


t) row; 


(int) 


(input[indexl] »» 16) 


= (input[indexl] >> 8) 
= input [index1] 


& Oxff; 


prow - row : 


> 


1) 3 


)-3 


& Oxff; 
& Oxi 


{ 
{backgroundColor.getRed () , 
tGreen () , 
or.getBlue () ) ; 


[] (backgroundColor.getRed () , 
tGreen () , 
or.getBlue () }; 


pecol = col; 


CEs 


7 


b 


(row * width + col) 


(nextRow * width + 
- nextCol) ; 


col) : 


int height, 


tr2 = (input[index2] >> 16) & Oxff; 
tg2 = (input[index2] >> 8) & Oxff; 
tb2 = input[index2] & Oxff; 


int tr = (int) (trl* (1-u) + tr2 * u); 
int tg = (int) (tgl * (1-0 + tg2 * u); 
int tb = (int) (tbl* (1-u) + tb2 * u); 
return new int[]{tr, tg, tb}; 


完整 的 基于 三 次 错 切 实现 图 像 旋 转 的 类 FastRotateFilter.java 请 下 载 阅览 ， 运 行 测试 该 类 时 ， 只 需要 在 ImagePaneljava 的 process 方 法 中 添加 如 下 几 行 代码 即 可 : 


double angle = 45; 
FastRatateFilter filter - new FastRatateFilter () ; 
filter.setAngle (angl 


e) 5 
ilter.setBackgroundColor (Color.CYAN) ; 
destImage = filter.filter (sourceImage, null) ; 


然后 运行 MainUl 类 ， 选 择 一 张 图 片 ， 单 击 【 处 理 】 按 钮 即 可 查看 效果 。 


需要 特别 说 明 的 是 FastRotatefFilter 中 并 没有 处 理 特殊 角度 (490°, 180°, 270%) ， 实 现任 意 角 度 的 选择 可 以 在 该 类 的 基础 上 增加 对 特殊 角度 旋转 支持 ， 这 部 分 的 编程 建议 读者 自己 动手 实现 ， 这 可 
帮助 你 理解 所 学 知识 ， 获 得 更 多 的 编程 实践 。 


7.6 小 结 


本 章 从 介绍 图 像 放大 采样 入 手 ， 详 细 介绍 了 图 像 快速 放大 的 几 种 方法 ， 接 着 通过 深入 剖析 图 像 插 值 常 用 的 几 种 方法 ， 由 浅 入 深 地 学 习 了 临近 点 插值 、 双 线性 插值 、 双 立方 插值 的 数学 知识 与 编程 实现 。 
其 中 对 双 立 方 重点 剖析 了 Blur 与 Sharpen 的 不 同 实现 选择 。 在 这 些 知识 的 基础 上 ， 介 绍 图 像 旋转 算法 ， 通 过 对 两 种 不 同 图 像 旋转 算法 的 实现 ， 读 者 很 容易 总 结 出 它们 各 自 的 优 缺 点 ， 使 自己 更 好 地 掌握 本 章 
知识 ， 活 学 活用 。 再 次 强调 一 点 ， 源 代码 是 本 书 内 容 一 部 分 ， 请 务必 动手 实现 ， 不 断 优化 本 书 中 已 经 提供 的 代码 。 本 章 目的 是 帮助 读者 解决 做 项 目 时 经 常 遇 到 的 关于 图 像 放 大 、 插 值 、 旋 转 等 问题 ， 为 读者 
提供 理论 知识 与 实践 经 验 ， 只 要 掌握 了 这 些 理论 知识 与 方法 ， 就 可 以 在 遇 到 此 类 问题 时 游 轧 有余。 同时 本 章 对 三 角 消 数 、 极 坐标 、 简 单 的 矩 阵 乘 法 等 知识 均 有 所 涉及 ， 也 希望 读者 能 够 花 点 时 间 了 解 一 下 这 
些 基 本 的 数学 知识 。 


第 8 草 ERRER 


第 7 章 中 对 像素 进行 处 理 时 ， 我 们 把 像素 看 成 一 个 个 二 维 的 坐标 点 ， 本 章 换 一 种 角度 ， 从 数字 信号 的 角度 来 考察 图 像 的 像素 数组 ， 通 过 数学 模型 来 表达 图 像 像素 数组 ， 对 图 像 使 用 空间 域 卷 积 公 式 进 行 卷 
只 计算 ， 根 据 采 用 的 卷 积 核 不 同 、 方 向 不 同 、 次 数 不 同 可 以 得 到 不 同 的 图 像 处 理 结果 ， 实 现 一 些 常见 的 图 像 处理 。 


本 章 的 数学 知识 中 最 重要 的 就 是 卷 积 概念 与 卷 积 运行 ， 数 学 上 的 图 像 卷 积 都 是 连续 的 ， 不 可 分 割 的 ， 但 是 对 图 像 来 说 ， 卷 积 可 以 是 离散 的 ， 这 就 为 图 像 卷 积 运行 提供 了 极 大 的 方便 。 


希望 通过 本 章 的 学 习 ， 读 者 能 对 图 像 有 一 个 新 的 认识 ， 不 再 只 是 以 像素 来 看 待 图 像 ， 而 是 可 以 从 信号 与 能 量 的 角度 来 看 待 。 思 路 的 转变 往往 给 人 带 来 质 的 改变 ， 希 望 本 章 的 学 习 为 读者 打开 图 像 处 理 的 


一 个 新 通道 。 


8.1 ”模糊 也 是 一 种 美 


现在 主流 的 图 像 处 理 APP 都 支持 照片 模糊 特效 ， 那 种 看 上 去 有 几 分 膀 胱 的 美丽 给 人 充分 的 想象 空间 ， 照 片 也 变 得 有 了 内 涵 。 其 实 这 种 模糊 效果 ， 只 需要 100 行 左右 的 代码 就 可 以 实现 ， 下 面 就 一 起 来 了 解 
一 下 。 


实现 处 理 的 编码 步骤 很 简单 ， 只 需要 读 取 源 图 像 像 素 ， 然 后 对 像素 进行 适当 的 处 理 即 可 ， 此 时 ， 输 出 的 图 片 就 是 具有 模糊 效果 的 图 片 。 完 整 的 源 代码 如 下 : 


package com.book.chapter.eight; 

import java.awt.image.BufferedImage; 

import com.book.chapter.four.AbstractBufferedImageOp; 

public class BlurFilter extends AbstractBufferedImageOp { 
private int[][] kernels- 

new tte Ats 14 Ly dig dg d). {ly 14 IJJ; 

public BlurFilter () 

{ 


System.out.println ("goldfish-filter") ; 


public void setKernels (int[][] kernels) { 
this.kernels = kernels; 


} 
@Override 
public BufferedImage filter (BufferedImage src, 


BufferedImage dest 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 


getRGB (src, 0, 0, width, height, inPixels) ; 
int index - 0; 
int kwRaduis = kernels[0].length/2; 
int khRaduis = kernels.length/2; 
double total = kernels.length * kernels.length; 
for (int row = 0; row < height; rowt-) { 
int ta = 0, tr = 0, tg=0, tb= 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
for (int subRow=-khRaduis; 
subRow<=khRaduis; subRow++) 


{ 


int nrow = row + subRow; 
if (nrow < 0 || nrow >= height) 


{ 
} 


for (int subCol=-kwRaduis; 
subCol«-kwRaduis; subCol++) 
{ 


nrow = 0; 


int ncol = col + subCol; 
if (ncol < O || ncol >= width) 


{ 


ncol = 0; 


int indexl = nrow * width + ncol; 


ta = (inPixels[indexl] >> 24) & Oxff; 

tr += (inPixels[indexl] >> 16) & Oxff; 
tg += (inPixels[indexl] >> 8) & Oxff; 

tb += inPixels[index1] & Oxff; 


tr = (int) (tr / total) ; 

tg = (int) (tg / total) ; 

tb = (int) (tb / total) ; 
outPixels[index] = (ta << 24) 
(tr << 16) 

| (tg << 8) | tb; 

// clean up for next pixel 


were we 


tr = 0; 
tg = 0; 
tb = 0; 


} 


setRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 


执行 如 下 几 行 代码 即 可 得 到 模糊 效果 : 


BlurFilter filter = new BlurFilter () ; 


destImage = filter.filter (sourceImage, null) ; 
从 上 述 代码 中 大 致 可 以 看 出 实现 图 像 模糊 需要 一 个 矩阵 乘 以 一 个 像素 点 值 及 其 周围 像素 点 值 ， 很 多 书 中 把 这 个 矩阵 称 为 卷 积 核 (Convolution Kernel) ， 而 把 利用 卷 积 核实 现 像素 计算 称 为 图 像 卷 积 ， 


模糊 只 是 图 像 卷 积 实现 的 效果 之 一 。 下 面 将 更 加 详细 地 介绍 图 像 卷 积 。 


8.2 图像 空间 域 卷 积 


本 节 将 从 数字 信号 处 理 的 观点 来 看 待 图 像 像素 值 ， 一 幅 数字 图 像 可 以 用 函数 F 表 示 为 : 


Fl (n,m) 
n=O m=O 


其 中 N、M 表 示 图 像 的 高 与 宽 ，p (n, m) 表示 点 (n, m) 的 像素 值 。 一 幅 图 像 可 以 抽象 地 看 成 一 个 二 维 数组 ， 其 中 每 个 离散 点 为 像素 值 ， 图 像 空间 域 卷 积 的 作用 就 是 改变 图 像 空 间 域 频 率 特征 。 另 外 
通过 观察 可 以 看 到 ， 图 像 是 由 一 系列 离散 的 像素 点 组 成 的 ， 所 以 在 介绍 卷 积 概念 与 相关 数学 知识 时 ， 为 了 更 容易 让 读者 理解 卷 积 ， 更 加 贴近 编程 实践 ， 只 介绍 离散 卷 积 知识 。 


mn) = 


首先 介绍 关于 卷 积 的 数学 知识 ， 离 散 卷 积 的 数学 公式 可 以 表示 为 如 下 形式 : 


k= 


其 中 C (k) 代表 卷 积 核 (FEB) , g (i) 代表 样本 数据 ，f (x) 代表 输出 结果 。 举 例如 下 : 假设 9 (i) 是 一 个 一 维 的 函数 ， 代 表 的 样本 数 为 G= [1, 2, 3, 4, 5, 6, 7, 8, 9], 假设 C(k) 是 一 个 一 维 
的 卷 积 操作 数 ， 操 作 数 为 C= [-1，0，1]， 则 输出 结果 f (x) 可 以 表示 为 


F = [1,2,2,2,2,2,2,2,1] ”1/ 边界 数据 未 处 理 


可 以 看 出 卷 积 从 本 质 上 说 是 将 两 个 不 同 数组 乘积 计算 产生 一 个 新 的 数组 的 方法 。 对 于 二 维 数组 的 任意 一 点 ， 其 卷 积 之 后 的 值 通过 如 下 计算 公式 得 到 : 


h 
Y(m.,n)- 2. Xm + k,n + DHE 


=a [=b 


其 中 X 表 示 图 像 像素 点 坐标 (m, n) 的 值 ，H 表 示 输 入 的 卷 积 核 (CESE) ，k、| 分 别 表示 卷 积 核 的 高 与 宽 。 假 设 图 像 的 高 与 宽 分 别 为 M、N， 则 m 与 n 的 取 值 范围 为 0，M-1] 与 [0，N-1]，a 与 b 的 值 
分 别 为 a = K/2 与 b = L/2， 示 意图 如 图 8-1 所 示 。 


图 8-1 高 斯 卷 积 示意 图 


通常 在 很 多 图 像 相关 知识 的 介绍 中 会 提 到 滤波 (Filter) ， 然 后 给 出 一 个 矩阵 (Matrix) 或 卷 积 核 (Convolution kernel) ， 显 然 这 个 时 候 我 们 知道 它 是 在 说 卷 积 ， 虽 然 本 书 不 涉及 频率 域 卷 积 知识 的 介 
绍 ， 但 还 是 不 得 不 提 及 一 下 ， 卷 积 操作 不 只 是 可 以 在 空间 域 完成 ， 还 可 以 对 图 像 进行 传 里 叶 变换 ， 然 后 到 频率 域 空 间 完成 。 本 书 不 会 对 其 进行 详细 介绍 ， 感 兴趣 的 读者 可 以 自己 去 学 习 。 


在 介绍 完 卷 积 基本 的 数学 知识 以 后 ， 读 者 不 禁 要 问 ， 为 什么 需要 对 图 像 进行 卷 积 操作 ? 答案 是 卷 积 操作 可 以 帮助 我 们 实现 图 像 如 下 四 个 方面 的 处 理 : 
1) 模糊 /平滑 (Smooth/Blur) 

2) 锐 化 (Sharpen) 

3) 增强 (Intensify) 

4) 提高 (Enhance) 

本 章 重点 讨论 图 像 卷 积 的 基本 知识 与 图 像 模糊 /平滑 处 理 ， 其 他 三 种 处 理 将 在 稍 后 的 章节 中 介绍 。 图 像 完整 卷 积 操作 的 编程 实现 步骤 大 致 如 下 : 

1) 读 取 图 像 像素 数组 。 


2) 根据 二 维 离散 卷 积 公式 ， 对 每 个 输入 像素 进行 卷 积 计算 。 


3) 对 计算 结果 归 一 化 处 理 ， 输 出 处 理 后 的 像素 值 。 
4) 循环 对 源 像 素数 组 的 每 个 像素 进行 2~ 3 步 的 处 理 ， 即 可 得 到 处 理 以 后 的 像素 数组 。 


在 处 理 卷 积 的 过 程 中 ， 当 卷 积 核 从 左 到 右 、 从 上 向 下 在 图 像 数 组 上 移动 时 ， 如 何 处 理 边 界 像素 ( 即 卷 积 核 与 像素 数组 没有 完全 重 芍 之 前 的 图 像 像 素 ) 也 是 一 个 很 实际 的 编程 问题 ， 常 见 的 处 理 方法 有 如 
下 三 种 。 


FHAR (Zero-Extend) : 对 于 没有 和 像素 数组 重 玛 部 分 的 卷 积 核 元 素 不 予 考 虑 ， 用 零 表 示 。 实 现代 码 如 下 : 


(col < 0 || col >= srcWidth 
|| row < 0 || row >= srcHeight) | 
continue; // just skip it or make it value as zero 


ms 


换行 (Wrap) : 通过 取 模 将 长 度 换 到 下 一 行 ， 右 边 换 到 左边 。 实 现代 码 如 下 : 


if (col < 0 || col >= srcWidth 
|| row < 0 || row >= srcHeight) { 

int nc = col / srcWidth; 
int nr = row / srcHeight; 
row = row - nr * srcHeight; // wrap row 
col = col - nc * srcWidth; // wrap col 
if (row < 0) 
row += srcHeight; 
if (col < 0) 

col += srcWidth; 


Boe (Crop) : 根据 长 度 靠近 边缘 大 小 取 值 为 0 或 图 像 宽 与 高 ， 直 接 获 取 边 缘 像素 但 是 不 修改 它们 的 值 。 实 现代 码 如 下 : 


// col 
if (col « 0) 
col = 0; 


else if (col >= srcWidth) 
col = srcWidth - 1; 


else 
col = col; 
// row 
if (row < 0) 
row = 0; 


else if (row »- srcHeight) 
row — srcHeight - 1; 


else 
row = row; 


上 述 三 种 边缘 处 理 方法 在 图 像 空间 域 卷 积 计算 中 经 常用 到 ， 还 有 一 种 比较 无 厘 头 的 处 理 边 缘 像 素 的 方法 是 本 书 中 一 直 使 用 的 ， 因 为 它 简单 而 明了 ， 代 码 如 下 : 


if (row < 0 || row >= height) { 
row = 0; 

} 

if (col < 0 || col >= width) { 
col = 0; 

} 

一 维 卷 积 


对 任意 一 个 二 维 像素 数组 ， 分 别 在 X 与 Y 方 向 进行 一 维 卷 积 处 理 与 一 次 完成 二 维 卷 积 计 算 处 理 得 到 的 结果 几 平 一 样 ， 对 图 像 X 与 Y 方 向 分 别 进行 一 维 卷 积 的 处 理 步骤 大 致 如 下 : 
1) 获取 源 图 像 像素 数组 。 

2) 对 卷 积 核 归 一 化 处 理 。 

3) 进行 X 方 向 的 卷 积 计算 ， 得 到 输出 数组 。 

4) 对 X 方 向 的 卷 积 计算 结果 继续 进行 Y 方 向 卷 积 计算 ， 得 到 输出 数组 。 

5) 对 得 到 的 输出 像素 数组 创建 返回 Image 对 象 。 


对 卷 积 核 归 一 化 预 处 理 的 代码 如 下 : 


// normalization kernels 
float sum = 0.0f; 
for (int i-0; i<kernels.length; i++) 


{ 


sum += kernels [i]; 


for (int i=0; i<kernels.length; i++) 


kernels[i] = kernels[i] /sum; 


实现 图 像 像素 一 维 单方 向 卷 积 的 关键 代码 如 下 : 


Cr = kernels2.length/2; 
index = 0; 
for (int row-0; row<height; rowt+) 


ct ct 


for (int col=0; col<width; col++) 


float sumr=0, sumg=0, sumb=0; 
for (int nr--cr; nr«-cr; nrt++) 


{ 


int offsetCol col + nr; 
f (offsetCol >=0 && offsetCol < width) 


pam, Es 


index = row * width + offsetCol; 


} 
// handle edge pixels 

lse if (edgeAction == ZERO EXTEND) 
{ 


} 
lse if (edgeAction == WRAP) 
{ 


continue; 


int ncol = offsetCol / width; 
offsetCol offsetCol- (ncol * width) ; 
if (offsetCol « 0) 


offsetCol += width; 


else if (edgeAction -- CROP) 
{ 


if (offsetCol < 0) 


offsetCol 0; 
else if (offsetCo] >= width) 
offsetCol = width - 1; 


} 
index = row * width + offsetCol; 
int rgb = inPixels [index]; 
sumr += kernels2[cr+nr] * ( (rgb >> 16) & Oxff) ; 
t= kernels2[crtnr] * ( (rgb >> 8) & Oxff) ; 
t= kernels2[crtnr] * (rgb & Oxff) ; 


— 


E 


} 
index = row * width + col; 
outPixels[index] = (255 << 24) 
(clamp (sumr) << 16) 
| (clamp (sumg) << 8) 
| clamp (sumb) ; 


完整 的 一 维 XY 方 向 卷 积 计算 代码 请 参见 源 文件 的 ConvolutionFilterjava 类 。 调 用 或 运行 测试 该 类 的 代码 如 下 : 


ConvolutionFilter filter = new ConvolutionFilter () ; 
filter.setKernels (new float[](1.0f, 1.0f, 1.0f, 1.0£, 1.0£}) ; 
destImage = filter.filter (sourceImage, null) ; 


8.3 ”盒子 模糊 与 高 斯 模糊 


在 学 习 与 理解 了 卷 积 数学 理论 、 图 像 卷 积 计算 基本 处 理 流程 、 边 缘 像 素 处 理 方 法 等 知识 之 后 ， 本 节 重 点 介绍 一 种 基于 卷 积 的 快速 模糊 方法 一 一 盒子 模糊 ， 然 后 通过 基本 的 高 斯 数学 知识 ,介绍 基于 高 斯 
模型 的 图 像 卷 积 模糊 。 和 希望 通过 这 些 重要 知识 的 学 习 ， 读 者 可 加 深 对 图 像 空间 域 卷 积 的 理解 与 掌握 ， 学 到 利用 数学 知识 解决 实际 问题 的 思路 与 方法 。 


8.4 ”边缘 保留 的 模糊 算法 一 一 高 斯 双边 模糊 


上 节 中 介绍 的 两 种 图 像 模糊 算法 都 没有 很 好 保留 图 像 细 节 ， 特 别 是 边缘 细节 ， 而 高 斯 双边 模糊 算法 正 是 一 种 边缘 保留 的 图 像 模 糊 算法 ， 它 的 应 用 也 十 分 广泛 ， 是 一 种 真正 实用 的 图 像 处 理 手段 ， 本 节 将 
按 从 原理 到 编程 细节 的 步骤 深入 剖析 该 算法 ， 帮 助 读者 掌握 相关 的 图 像 处 理 方 法 。 


1. 高 斯 双边 模糊 原理 

一 般 的 高 斯 模糊 有 如 下 几 个 特征 : 

1) 基于 正 态 分 布 的 线性 卷 积 计算 。 

2) 权重 系数 依赖 于 距离 。 

3) o 是 经 验 值 ， 取 决 于 具体 应 用 场景 。 


从 上 面 可 以 看 出 高 斯 模糊 没有 考虑 像素 变化 的 影响 ， 只 考虑 了 像素 距离 对 中 心 像素 的 影响 ， 因 此 图 像 边缘 也 被 模糊 了 。 而 基于 高 斯 的 双边 模糊 则 考虑 了 像素 值 变化 的 影响 ， 基 于 高 斯 分 布 计算 了 像素 值 
的 权重 ， 从 而 产生 两 个 权重 表 ， 一 个 基于 像素 空间 位 置 权重 。 一 个 基于 像素 值 变化 权重 。 双 边 模 糊 的 定义 如 下 : 
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F| A : 
P \ = Tr p 
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其 中 1/Wp 称 为 归 一 化 因子 ， 是 所 有 权重 系数 之 和 ; a |" -| ) 是 基于 空间 位 置 的 权重 系数 的 高 斯 分 布 ; “" |/ PRR OER, RANER, WERE LESH 


表述 如 图 8-3 所 示 。 
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图 8-3 ”双边 模糊 示意 图 
在 图 8-3 中 ，as 指 空间 位 置 高 斯 分 布 参数 ， 取 值 与 图 像 大 小 成 正比 ， 通 常 为 图 像 对 角 线 长 度 的 2%; ar 指 图 像 像素 高 斯 分 布 参数 ， 取 值 与 图 像 振幅 成 正比 ， 通 常 为 图 像 梯度 的 中 值 或 平均 值 。 


前 面 提 到 的 盒子 模糊 与 高 斯 模糊 本 质 上 都 可 以 看 成 图 像 线性 滤波 ， 而 双边 滤波 是 非 线性 滤波 卷 积 ， 且 计算 量 比较 大 ， 有 时 候 我 们 还 会 对 图 像 完成 多 次 双边 滤波 即 和 迭代 双边 滤波 ， 公 式 表 示 为 : 
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Fi 


图 
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高 斯 双边 模糊 的 优点 有 如 下 几 项 : 

1) 边缘 保留 。 

2) 虽然 是 非 线 性 滤波 但 是 为 非 迭 代 滤 波 。 
3) 计算 简单 。 


相 比 前 面 介 绍 的 卷 积 模糊 计算 ， 双 边 模 糊 的 计算 量 比较 大 。 


I p.q) = 


空间 位 置 的 权重 表 索 引 建立 的 代码 如 下 : 


int size = 2 * radius + 1; 

sWeightTable = new double[size] [size]; 

for (int sr = -radius; sr <= radius; sr++) | 

for (int sc = - radius; sc <= radius; sctt+) { 
// 计算 欧 几 里 得 距离 


double delta = Math.sqrt (sr * sr + sc * sc) /sigmas; 

// 根据 一 维 高 斯 公式 ， 计 算 高 斯 权重 系数 

double deltaDelta delta * delta; 

int row = sr + radius; 

int col = sc + radius; 

sWeightTable[row][col] = Math.exp (deltaDelta * factor) ; 


其 中 sSWeightTable 为 像素 位 置 权重 查找 表 数 组 ，sigmas 为 空间 位 置 高 斯 分 布 参数 。 


图 像 像素 高 斯 分 布 权重 查找 表 建 立 的 代码 如 下 : 


// 像素 值 范围 是 [0，255] 

rWeightTable = new double[256]; 

// 计算 像素 值 的 高 斯 权重 

for (int i-0; i«256; i++) { 
double delta = Math.sqrt (i * i) / sigmar; 
double deltaDelta delta * delta; 
rWeightTable[i] = Math.exp (deltaDelta * factor) ; 


其 中 rWeightTable 为 图 像 像素 高 斯 分 布 权重 查找 表 ，sigmar 为 图 像 像素 高 斯 分 布 参 数 ， 因 为 像素 取 值 范围 为 0~255 之 间 ， 所 以 查找 表 大 小 为 256。 权 重 系数 计算 都 是 基于 一 维 高 斯 分 布 公式 的 。 从 查找 
表 建 立 代码 可 以 看 出 双边 模糊 (滤波 ) 效果 跟 下 面 几 个 输入 参数 有 关系 : 


1) 空间 分 布 高 斯 o 的 大 小 。 

2) 像素 值 分 布 高 斯 0 的 大 小 。 

3) 高 斯 卷 积 核 半径 大 小 。 

4) 迭代 次 数 (这 里 不 做 讨论 ， 当 然 可 以 多 次 重复 双边 模糊 ) 。 
3. 程 序 实现 详解 

双边 模糊 算法 的 代码 实现 大 致 可 以 分 为 如 下 几 步 : 

1) 根据 输入 参数 ， 建 立 查找 表 。 

2) 循环 每 个 一 个 像素 。 

3) 对 像素 进行 空间 权重 与 像素 值 权重 高 斯 卷 积 计算 ， 同 步 计算 权重 和 。 
4) 归 一 化 得 到 卷 积 之 后 的 输出 像素 值 。 

5) 返回 计算 之 后 的 像素 数组 。 


为 了 方便 大 家 阅读 代码 ， 代 码 中 添加 了 很 多 注释 ， 完 整 的 双边 模糊 代码 如 下 : 


package com.book.chapter.eight; 
import java.awt.image.BufferedImage; 
import com.book.chapter.four.AbstractBufferedImageOp; 
public class BilateralFilter extends AbstractBufferedImageOp { 
public final static double factor = -0.5d; 
private double sigmas; // space 
private double sigmar; // range 
private int radius; 
private double[][] sWeightTable; 
private double[] rWeightTable; 
public BilateralFilter () 
{ 


radius 
sigmas 
sigmar 


tot gd 
C) CO ND 


} 
public double getSigmas () { 
return sigmas; 


} 
public void setSigmas (double sigmas) { 
this.sigmas = sigmas; 


} 
public double getSigmar () { 
return sigmar; 


} 
public void setSigmar (double sigmar) (| 
this.sigmar = sigmar; 


} 

public int getRadius () | 
return radius; 
} 
public void setRadius (int radius) { 
this.radius = radius; 


} 
private void buildSpaceWeightTable () { 
int size = 2 * radius + 1; 
sWeightTable = new double[size] [size]; 
for (int sr = -radius; sr <= radius; Sr++) { 
for (int sc = - radius; sc <= radius; sc++) { 
// 计算 欧 几 里 得 距离 
double delta = Math.sqrt (sr * sr + sc * sc) /sigmas; 
// 根据 一 维 高 斯 公式 ， 计 算 高 斯 权重 系数 
double deltaDelta delta * delta; 
int row = sr + radius; 
int col = sc + radius; 
sWeightTable [row] [col] = Math.exp (deltaDelta * factor) ; 


} 
} 
private void buildRangeWeightTable () { 
// 像素 值 范围 是 [0，255] 
rWeightTable = new double[256]; 
// 计算 像素 值 的 高 斯 权重 
for (int i=0; i«256; i++) { 
double delta = Math.sqrt (i * i) / sigmar; 
double deltaDelta delta * delta; 
rWeightTable[i] = Math.exp (deltaDelta * factor) ; 


} 
} 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
//int sigmaMax = (int) Math.max (ds, rs) ; 
//radius = (int) Math.ceil (2 * sigmaMax) ; 
radius = (int) Math.max (sigmas, sigmar) ; 


算 实 现 ， 感 兴趣 的 读者 可 以 进 一 
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inPixels[index2] 
// 在 查找 表 中 获取 对 应 权重 
sWeightTable [semirowtradius] [semicolt+radius] 
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& Oxff; 


BlueWeight = 


0, csSumBlueWeight 


) 


inPixels ) ; 


0s 


radius; 


semicol «- radius; 
(row + semirow) 
semirow; 


(semicol + col) 
lOffset = col + semicol; 


& Oxff; 
& Oxff; 
& Oxff; 


CS 


// 累加 权重 之 和 


BlueWeight = sWeightTable[semirowtradius] [semicol 


csSumRedWeight += csRedWeight; 


csSumGreenWeight += csGreenWeight; 


csSumBlueWeight += cs 


// 累加 权重 像素 之 和 


redSum += 
greenSum += 
blueSum += 


} 


(csRedWeight * 
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} 
// 归 一 化 获取 双边 滤波 之 后 的 像素 值 
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teralFilter () ; 
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mage = 


filter. 


filter (sourceImage, 


null) ; 


双边 模糊 是 游戏 与 图 像 美化 类 手机 APP 经 常 使 用 的 图 像 处 理 方法 ， 


步 阅读 与 研究 。 


8.5 ”像素 格 特效 


本 质 


在 学 习 了 几 种 图 像 模糊 方法 之 后 ， 让 我 们 轻松 一 下 ， 学 习 一 种 很 有 趣 而 且 实 用 的 图 像 特效 一 一 像素 格 特效 。 从 本 质 上 来 说 ， 图 像 像 素 格 特效 是 一 种 图 像 向 下 采样 ， 降 低 图 像 像 素 分 


质 是 把 像素 数组 分 为 求 取 方 格 范围 内 像素 的 平均 值 ， 然 


BlueWeight = 0; 
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， 只 需要 如 下 几 行 代码 即 可 : 


是 一 种 非常 重要 的 非 线 性 低 通 


semirow--) { 
semicol++) { 


< height) { 


< width) { 
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* rWeightTable[ 
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甬 滤 波 方 法 。 如 何 提 高 


合 该 方 格 内 的 每 个 像素 ， 


(Math.abs (tr2 - tr) ) ] 
(Math.abs (tg2 - tg) ) ] 
(Math.abs (tb2 - tb) ) ] 


| clamp (tb) ; 


边 模糊 算法 的 执行 速度 也 是 一 个 很 大 的 挑战 ， 最 常用 的 就 是 通过 近似 线性 卷 积 计 


> 辩 率 的 方法 ， 该 方法 
这 样 就 完成 了 图 像 的 像素 格 特效 ， 最 终 的 效果 如 图 8-4 所 示 。 


图 8-4 像素 格 效果 图 像 


这 也 是 很 多 图 像 处 理 与 编辑 类 APP 应 用 的 常见 功能 ， 编 程 实现 像素 格 效果 的 具体 步骤 如 下 : 


1) 获取 输入 像素 数组 。 


2) 根据 像素 格 大 小 ， 计 算 每 个 像素 格 内 像素 平均 值 。 


3) 根据 计算 的 平均 值 给 各 个 像素 格 内 的 每 个 像素 赋值 。 


4) 循环 完成 对 每 个 像素 格 处 理 ， 得 到 输出 像素 数组 。 


完整 的 图 像 像 素 格 效果 的 代码 如 下 : 


package com.book.chapter.eight; 


import java.awt.image.Buf 


FeredImage; 


import com.book.chapter.four.AbstractBufferedImageOp; 
public class PixellateFilter extends AbstractBufferedImageOp 
private int size; 
public PixellateFilter () { 
// default block size-10x10 
size = 10; 
public PixellateFilter (int size) { 
this.size - size; 
} 
@Override 
public BufferedImage filter (BufferedImage src, 


int width = src.getWidth () ; 


int height = 
if ( dest == 
dest = 


int[] inPixels 
int [] 


outPixels 


src.getHeight () ; 
null ) 
createCompatibleDest]1 
new int[width*height]; 


[mage ( src, 


null ) ; 


new int[width*height] ; 


getRGB ( src, 0, 0, width, height, inPixels ) ; 
int index = 0; 
int offsetX = 0, offsetY = 0; 
int newX = 0, newY = 0; 
double total = size*size; 
double sumred = 0, sumgreen = 0, sumblue = 0; 
for (int row-0; row«height; rowt+) { 
int ta = 0, tr» 0, tg=0, tb= 0; 
for (int col=0; col<width; col++) { 
// 寻找 当前 像素 格 
newY — (row/size) * size; 
newX = (col/size) * size; 
offsetX = newX + size; 
offsetY = newY + size; 
// 计算 像素 格 内 像素 值 之 和 


if (subRow <0 || subRow >= height) { 
continue; 
} 
if (subCol < 0 || subCol >=width) { 
continue; 
} 
index = subRow * width + subCol; 
ta = (inPixels[index] >> 24) & Oxff; 
sumred += (inPixels[index] >> 16) & Oxff; 
sumgreen += (inPixels[index] >> 8) & Oxff; 
sumblue += inPixels[index] & Oxff; 
} 
} 
// 计算 平均 值 
index = row * width + col; 
tr = (int) (sumred/total) ; 
tg = (int) (sumgreen/total) ; 
tb = (int) (sumblue/total) ; 
outPixels[index] = (ta << 24) | (tr << 16) | (tg << 8) 
// 清空 计算 下 一 个 像素 
sumred = sumgreen = sumblue = 0; 
} 
} 
SetRGB ( dest, 0, 0, width, height, outPixels ) ; 


turn dest; 


for (int subRow -newY; 
for (int subCol -newX; 


subRow < offsetY; 


subCol « offsetX; 


{ 


BufferedImage dest) 


subRow--) ( 
subCol++) 


{ 


{ 


| tb; 


代码 实现 简单 明了 ， 其 中 添加 相关 注释 目的 是 方便 读者 阅读 与 理解 。 本 节 所 学 知识 权 当 放松 ， 增 强 学 习 知 识 过 程 中 的 趣味 性 。 默 认 时 像素 格 的 大 小 为 10x 10 像 素 ， 运 行 与 测试 该 PixellateFilter,java 的 代 
码 如 下 : 


PixellateFilter filter new PixellateFilter () ; 
destImage = filter.filter (sourceImage, null) ; 


8.6 RMA: ERAR 

本 节 将 展示 图 像 卷 积 在 现实 中 的 应 用 ， 卷 积 除了 产生 那些 美 轮 美 钢 的 模糊 图 片 之 外 ， 另 外 还 被 用 来 降低 或 消除 图 像 的 各 种 不 同 噪声 ， 实 现 图 像 平 滑 预 处 理 ， 为 后 续 图 像 处 理 打 下 基础 ， 这 是 很 多 图 像 处 
理 算 法 最 初 的 一 步 。 有 噪声 的 图 像 可 以 抽象 为 如 下 的 数学 模型 : 

g (x, y) =f (x, y) + (x, y) 

其 中 f (x, y) 表示 原 图 像 像 素 、n (x, y) 表示 该 像素 噪声 、g (x, y) 表示 结果 噪声 图 像 像 素 ， 根 据 不 同 噪声 模型 大 致 可 以 分 为 高 斯 噪声 、 指 数 噪声 、 椒 盐 噪 声 等 。 


图 像 去 噪 时 ， 根 据 产 生 的 噪声 不 同 ， 使 用 的 方法 也 不 一 样 ， 不 管 是 在 频率 域 ， 还 是 在 空间 域 都 可 以 完成 图 像 去 噪 。 本 节 内 容 主要 针对 空间 域 ， 利 用 卷 积 知识 实现 图 像 滤波 去 噪声 ， 根 据 选 择 的 卷 积 核 的 
不 同 可 以 实现 不 同 噪声 的 滤波 ， 常 见 的 空间 域 噪声 卷 积 处 理 大 致 可 以 分 为 如 下 几 种 。 


1. 均 值 滤波 


均值 滤波 ， 是 卷 积 处 理 中 最 常用 的 方法 ， 从 频率 域 的 角度 来 看 ， 均 值 滤波 是 一 种 低 通 滤 波 器 ， 高 频 信号 将 会 去 掉 ， 因 此 可 以 消除 图 像 尖锐 噪声 ， 实 现 图 像 平 滑 、 模 糊 等 功能 。 理 想 的 均值 滤波 会 用 每 个 
像素 和 它 周 围 的 像素 计算 出 来 的 平均 值 蔡 换 图 像 中 的 像素 。 采 样 的 卷 积 核 (Kernel) 数据 通常 是 3x 3 的 矩阵 ， 如 下 表示 : 


卷 积 核 
黑色 粗 体 1 为 中 心 像素 ， 
周围 八 个 像素 计算 九 个 
像素 的 平均 值 ， 替 换 
中 心 像 素 值 


按 从 左 到 右 、 从 上 到 下 的 顺序 ， 卷 积 核 经 过 图 像 中 的 每 个 像素 ， 最 终 得 到 处 理 后 的 图 像 。 均 值 滤波 可 以 加 上 两 个 参数 ， 即 迭代 次 数 与 卷 积 核 和 矩阵 大 小 。 在 卷 积 核 和 矩阵 大 小 相同 时 ， 运 代 次 数 越 多 效果 就 
越 好 ; 同样 ， 运 代 次 数 相同 的 情况 下 ， 卷 积 核 矩 阵 长 与 宽 越 大 ， 均 值 滤波 的 效果 就 越 明 显 。 常 见 的 平均 值 的 计算 方法 有 如 下 三 种 : 


1) 算术 平均 值 ， 当 采用 算术 平均 值 实现 均值 滤波 时 ， 其 滤波 的 数学 公式 可 以 表示 为 如 下 : 
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其 中 m、n 分 别 表示 卷 积 核 行 与 列 的 大 小 。 


2) 几何 平均 值 ， 当 采用 几何 平均 值 实现 均值 滤波 时 ， 其 滤波 的 数学 公式 可 以 表示 为 如 下 : 
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其 中 m、n 分 别 表示 卷 积 核 行 与 列 的 大 小 。 


3) 调和 平均 值 ， 当 采用 调和 平均 值 实现 均值 滤波 时 ， 其 滤波 的 数学 公式 可 以 表示 为 如 下 : 


基于 算术 平均 值 的 去 噪声 只 是 简单 的 像素 模糊 ， 效 果 并 不 是 很 好 ， 而 基于 几何 平均 值 的 去 噪声 所 产生 的 效果 与 算术 平均 值 滤波 类 似 ， 只 是 在 模糊 时 保留 了 更 多 的 图 像 细节 ， 而 最 后 一 种 调和 平均 值 滤波 
几乎 可 明显 去 除 所 有 的 噪声 ， 特 别 是 对 高 斯 噪声 效果 尤 佳 。 根 据 卷 积 核 大 小 计算 中 心 像 素 均值 的 代码 如 下 : 


private int[] calculateMeans (int[][] windowsPixels) 


int rows = windowsPixels.length; 
int cols = windowsPixels[0].length; 


int[] rgb = new int[3]; 
double total = rows * cols; 
double redSum = 0, greenSum = 0, blueSum = 0; 


if (this.type == GEOMETRIC TYPE) 


redSum = 1; 
greenSum = 1; 
blueSum = 1; 


for (int row-0; row<rows; rowt+) 


for (int col-0; col«cols; col++t) 


{ 


double r = (windowsPixels[row] [col] >> 16) & Oxff; 
double g = (windowsPixels[row][col] >> 8) & Oxff; 
double b = windowsPixels[row] [col] & Oxff; 

if (this.type == ARITHMETIC TYPE) 


redSum += r; 
greenSum += g; 
blueSum += b; 


else if (this.type == GEOMETRIC TYPE) 


redSum = r * redSum; 
greenSum = g * greenSum; 
blueSum = b * blueSum; 


else if (this.type == HARMONIC TYPE) 
redSum += 1.0d/r; 
greenSum += 1.0d/g; 
blueSum += 1.0d/b; 


} 


f (this.type == ARITHMET C TYPE) 


a hw 


rgb[0] = (int) (redSum/total) ; 
rgb[1] = (int) (greenSum/total) ; 
rgb[2] = (int) (blueSum/total) ; 


else if (this.type == GEOMETRIC TYPE) 


rgb[0] = (int) Math.pow (redSum, 1.0d/total) ; 
rgb[1] = (int) Math.pow (greenSum, 1.0d/total) ; 
rgb[2] = (int) Math.pow (blueSum, 1.0d/total) ; 


} 
else if (this.type == HARMONIC TYPE) 


{ 


rgb[0] = (int) (total/redSum) ; 
rgb[1] = (int) (total/greenSum) ; 
rgb[2] = (int) (total/blueSum) ; 
} 


return rgb; 


使 用 均值 滤波 时 ， 首 先 根 据 卷 积 核 矩 阵 大 小 计算 窗口 长 度 ， 然 后 计算 卷 积 窗口 下 所 有 像素 值 忆 和， 边缘 像素 卷 积 计算 时 对 X 方 向 超出 图 像 宽度 width 的 或 小 于 0 的 直接 取 0， 对 Y 方 向 同样 ， 超 出 高 度 或 小 
于 0 的 直接 取 0。 得 到 所 有 像素 和 之 后 再 除 以 卷 积 窗口 的 大 小 ， 即 得 到 最 终 平均 像素 值 。 如 果 是 RGB 彩 色 图 像 ， 对 各 个 通道 进行 同样 的 处 理 即 可 。 完 整 的 均值 滤波 的 代码 请 参见 源 文 件 的 SmoothrFilterjava, 
运行 与 测试 该 代码 这 里 不 再 袭 述 。 

2. 中 值 滤波 

中 值 滤波 也 是 消除 图 像 噪声 最 常见 的 手段 之 一 ， 特 别 是 消除 椒盐 噪声 ， 中 值 滤波 的 效果 比 均值 滤波 更 好 。 中 值 滤波 与 均值 滤波 的 唯一 不 同 之 处 在 于 ， 它 不 是 用 均值 来 蔡 换 中 心 每 个 像素 的 ， 而 是 将 周围 
像素 和 和 中心 像 素 排序 以 后 ， 取 中 值 。 一 个 3x 3 大 小 的 中 值 滤波 可 表示 如 下 : 


-- Fel BLATT ER RS T. : 
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" 中 值 : 124 


使 用 中 值 滤波 时 ， 首 先 根 据 卷 积 核算 阵 大 小 计算 窗口 长 度 ， 然 后 获得 卷 积 核算 阵 重 苇 下 的 每 个 像素 值 ， 排 序 之 后 ， 获 取 中 值 作为 中 心 点 像素 值 。 对 每 个 像素 点 都 重复 这 样 的 操作 就 完成 了 整个 图 像 的 中 
值 滤波 。 


3. 最 大 最 小 值 滤波 


最 大 最 小 值 滤波 也 是 一 种 常见 的 图 像 统计 滤波 方法 ， 其 基本 原理 是 用 最 大 最 小 值 之 差 作 为 卷 积 核 覆 盖 像 素 下 的 中 心 像 素 值 ， 对 每 个 像素 完成 此 操作 即 实 现 了 图 像 的 最 大 最 小 值 滤波 。 假 设 灰 度 像素 值 


最 大 但 为 : 210 
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这 里 ， 最 大 最 小 值 滤波 操作 中 心 像素 值 从 77 变 成 为 200， 最 大 最 小 值 滤波 可 表示 为 如 下 公式 : 
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最 大 最 小 值 滤波 也 是 一 种 很 好 的 边缘 检测 的 滤波 方法 ， 关 于 边缘 检测 的 更 多 话题 将 在 第 9 章 中 详细 阐述 。 

4. 最 大 值 滤波 


最 大 值 滤波 是 寻找 卷 积 核 窗 口内 像素 值 最 大 的 像素 来 蔡 换 中 心 像素 ， 对 图 像 的 每 个 像素 完成 此 操作 即 实 现 了 图 像 的 最 大 值 滤波 ， 假 设 灰 度 像素 3x 3 的 窗口 如 下 : 


最 大 值 为 : 210 


这 里 ， 最 大 值 滤波 操作 中 心 像 素 77 变 成 为 210， 最 大 值 滤波 可 表示 为 如 下 公式 : 
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5. 最 小 值 滤波 


最 小 值 滤波 与 图 像 最 大 值 滤波 的 操作 类 似 ， 唯 一 不 同 的 是 用 窗口 内 最 小 像素 替换 中 心 像素 值 ， 同 样 假设 灰 度 像素 3x 3 的 窗口 如 下 : 
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这 里 ， 最 小 值 滤波 操作 中 心 像 素 从 77 变 成 了 10， 最 小 值 滤波 可 表示 为 如 下 公式 : 
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最 大 值 与 最 小 值 滤波 对 图 像 的 椒盐 噪声 有 较 好 效果 。 


6. 中 间 点 滤波 


中 间 点 滤波 操作 是 把 卷 积 窗口 内 的 像素 最 大 值 与 最 小 值 相 加 以 后 取 平 均值 来 替换 中 心 像素 值 ， 同 样 假设 灰 度 像素 3x 3 的 窗口 如 下 : 
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这 里 ， 中 间 点 滤波 操作 中 心 像素 从 77 变 成 110， 中 间 点 滤波 可 表示 为 如 下 公式 ,: 
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中 间 点 滤波 对 图 像 的 高 斯 噪声 与 均匀 噪声 有 很 好 的 效果 。 


均值 滤波 方法 属于 线性 卷 积 方法 ， 而 其 他 各 种 滤波 去 噪声 方法 属于 统计 滤波 方法 。 上 面 已 经 实现 了 均值 滤波 的 编码 。 对 于 这 几 种 统计 滤波 的 方法 ， 去 噪 效果 还 跟 卷 积 窗 口 的 大 小 有 关系 ， 在 类 
statisticsFilter 中 的 默认 大 小 为 3x3， 但 是 可 以 根据 输入 参数 进行 调整 。 编程 实现 统计 滤波 去 噪声 的 步骤 可 以 分 为 如 下 几 步 : 


1) 获取 输入 图 像 的 像素 数组 。 

2) 对 卷 积 窗口 内 的 像素 排序 。 

3) 根据 选择 的 统计 滤波 方法 ， 计 算出 中 心 像素 值 。 
4) 循环 每 个 像素 完成 第 二 和 第 三 步 的 操作 。 

5) 输出 滤波 以 后 的 数组 。 


完整 的 基于 卷 积 统计 滤波 StatisticsFilter.java 的 代码 如 下 : 


package com.book.chapter.eight; 

import java.awt.image.BufferedImage; 
import java.util.Arrays; 
import com.book.chapter.four.AbstractBufferedImageOp; 


public class StatisticsFilter extends AbstractBufferedImageOp { 

public final static int MAX FILTER = 1; 
public final static int MIN FILTER - 2; 
public final static int MIN MAX FILTER - 4; 
public final static int MEADIAN FILTER - 8; 
public final static int MID POINT FILTER - 16; 
private int kernel size = 3; // default 3 
private int type = 8; // default mean type 
public StatisticsFilter () 

{ 

System.out.println ("Statistics Filter") ; 


ublic int getKernelSize () { 
return kernel size; 


Ow 


ublic void setKernelSize (int kernelSize) { 
this.kernel size = kernelSize; 


Ow 


ublic int getType () { 
return type; 


Ow 


} 
public void setType (int type) { 
this.type = type; 


@Override 

public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 

if ( dest == null ) 


dest = createCompatibleDestImage ( src, null ) ; 
int[] inPixels = new int[width*height] ; 
int[] outPixels = new int[width*height]; 


getRGB ( src, 0, 0, width, height, inPixels ) ; 
int rows2 = kernel size/2; 

int cols2 - kernel size/2; 

int index - 0; E 


int index2 = 0; 

float total kernel size * kernel size; 
int[][] matrix = new int[3][ (int) total]; 
for (int y=0; y < height; yt) { 


for (int x = 0; x < width; x++) { 
int count = 0; 

for (int row = -rows2; row <= rows2; rowtt+) { 
int rowoffset = y + row; 

if (rowoffset < 0 || rowoffset >=height) { 


rowoffset = y; 


for (int col = -cols2; col <= cols2; colt+) { 
int coloffset = col + x; 

if (coloffset < 0 || coloffset >= width) 

{ 


} 
index2 = rowoffset * width + coloffset; 

matrix[0] [count] (inPixels[index2] >> 16) & Oxff; 
matrix[1] [count] (inPixels[index2] >> 8) & Oxff; 
matrix[2] [count] inPixels[index2] & Oxff; 

count++; 


coloffset = x; 


} 
} 
// 统计 滤波 


int[] rgb = performFilter (matrix) ; 

int ia = Oxff; 

int ir - rgb[0]; 

int ig = rgb[1]; 

int ib = rgb[2]; 

outPixels[index--] = (ia << 24) | (ir << 16) | (ig << 8) | ib; 


} 
} 
// return result 
SetRGB ( dest, 0, 0, width, height, outPixels ) ; 
return dest; 


} 
private int[] performFilter (int[][] matrix) { 
// pick up one filter from here! ! ! 
int[] rgb = new int[3]; 
int[] trs = matrix[0]; 
int[] tgs = matrix[1]; 
int[] tbs = matrix[2]; 
// 默认 升序 排序 
Arrays.sort (trs) ; 
Arrays.sort (tgs) ; 
Arrays.sort (tbs) ; 
int count = kernel size * kernel size; 


// 中 值 滤波 


if (this.type == MEADIAN FILTER) 
{ 
rgb[0] = trs[count/2]; 
rgb[1] = tgs[count/2]; 
rgb[2] = tbs[count/2]; 


} 

// 最 大 最 小 值 滤波 

else if (this.type == MIN MAX FILTER) 
{ 


rgb[0] = trs[count-1] - trs[0]; 
rgb[1] = tgs[count-1] - tgs[0]; 
rgb[2] = tbs[count-1] - tbs[0]; 


} 

// 最 大 值 滤波 
else if (this.type == MAX FILTER) 
{ 


rgb[0] = trs[count-1]; 
rgb[1] = tgs[count-1]; 
rgb[2] = tbs[count-1]; 


} 

// 最 小 值 滤波 
else if (this.type -- MIN FILTER) 
{ 


rgb[0] = trs[0]; 
rgb[1] — tgs[0]; 
rgb[2] = tbs[0]; 


} 
// 中 间 点 滤波 


else if (this.type == MID POINT FILTER) 

{ 
rgb[0] = (trs[0] + trs[count-1]) /2; 
rgb[1] = (tgs[0] + tgs[count-1]) /2; 
rgb[2] = (tbs[0] + tbs[count-1]) /2; 


} 


return rgb; 


c 


运行 与 测试 统计 滤波 类 时 ， 只 需要 如 下 几 行 代码 即 可 : 


StatisticsFilter filter = new StatisticsFilter () ; 
filter.setType (StatisticsFilter.MID POINT FILTER) ; 
destImage = filter.filter (sourceImage, null) ; 


本 节 介 绍 了 基于 卷 积 的 图 像 恢 复 与 质量 提升 的 方法 ， 这 些 应 用 都 基于 一 些 简单 实用 的 数学 知识 ， 想 对 图 像 恢 复 与 质量 提升 有 更 深 了 解 的 读者 ， 可 以 自己 进一步 探索 。 


8.7 图像 铝 化 、 拉 普 打 斯 滤波 


基于 卷 积 的 图 像 铝 化 是 图 像 质量 提升 的 常规 手段 ， 是 图 像 空间 域 卷 积 滤波 方法 之 一 。 从 本 质 上 来 说， 拉 普 拉 斯 (Laplacian) 操作 是 基于 二 阶 导数 的 图 像 增强 方法 ， 图 像 经 过 拉 普 拉 斯 滤波 操作 之 后 的 好 
处 是 可 以 发 现 更 多 的 图 像 细 节 ， 这 通常 被 称 为 图 像 锐 化 (Image Sharpen) 。 注 意 拉 普 拉 斯 滤波 只 是 图 像 锐 化 的 方法 之 一 ， 但 却 是 最 常见 与 最 重要 的 方法 。 


1. 拉 普 拉 斯 算 子 


拉 普 拉 斯 操作 的 完成 基于 卷 积 图 像 与 卷 积 核 (窗口 ) ， 完 成 卷 积 功能 的 拉 普 拉 斯 卷 积 核 最 常见 的 是 3x3 大 小 的 卷 积 核 ， 如 图 8-5 所 示 。 


图 8-5 FFI 


图 8-5 所 示 的 是 两 种 最 常用 的 拉 普 拉 斯 卷 积 核 。 拉 普 拉 斯 滤波 的 数学 公式 如 下 : 
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即 分 别 求 取 X 方 向 与 Y 方 向 的 二 阶 导数 ， 对 于 一 幅 离 散 的 数字 图 像 像 素数 组 来 说 : 


和 方向 二 阶 导 数 可 以 表示 为 一 =2Hxzy) -f(x+1,y) -f(x-1,y) 
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介 导 数 可 以 表示 为 4 l = fixy) —f(x,y —-1) —-f(x,y +1) 


即 得 到 图 8-5 中 3x 3 左边 第 一 个 常用 拉 普 拉 斯 卷 积 核 ， 第 二 个 是 第 一 个 的 进一步 拓展 而 已 。 

2. 铝 化 步骤 

基于 拉 普 拉 斯 操作 实现 图 像 锐 化 的 步骤 如 下 : 

1) 图 像 拉 普 拉 斯 操作 ， 得 到 细节 保留 的 图 像 。 

2) 基于 第 一 步 的 结果 ， 寻 找 最 小 值 ， 减 去 最 小 值 之 后 ， 根 据 最 大 值 ， 将 图 像 Scale 到 0~255 之 间 ， 输 出 处 理 以 后 像素 数组 。 
3) 将 第 二 步 输出 的 像素 数组 与 原 像 素 值 一 一 相 加 ， 再 减 去 最 小 值 之 后 ， 根 据 最 大 值 归 一 化 图 像 像素 值 到 0~ 255 之 间 。 

4) 输出 到 处 理 以 后 的 像素 数组 。 

5) 直方 图 拉 伸 ， 让 锐 化 以 后 的 图 像 看 上 去 跟 原 图 的 亮度 保持 一 致 。 

3. 关 键 程序 解析 


像素 Scale 技巧 ， 如 何 将 不 在 0~255 之 间 的 像素 变 成 0~255 之 间 的 像素 是 一 个 简单 的 数学 问题 ， 只 要 找到 最 大 最 小 值 之 后 ， 根 据 比例 不 变 的 特性 ， 扩 展 到 0~255 取 值 范 围 之 内 即 可 。 完 整 的 Scale 像素 值 


的 实现 代码 如 下 : 


private void scalePixels (int[][] rgbPxiels) 
{ 


// scale to 0~255 


Float minRed 255, minGreen = 255, minBlue = 255; 
Float maxRed 0, maxGreen = 0, maxBlue = 0; 

for (int i=0; i<rgbPxiels.length; i++) 

{ 

minRed = Math.min (minRed, rgbPxiels[i][0]) ; 
minGreen = Math.min (minGreen, rgbPxiels [i] [1 ] z 
minBlue = Math.min (minBlue, rgbPxiels[i][2]) ; 


for (int i20; i«rgbPxiels.length; i++) 
{ 
rgbPxiels [i] [0 
rgbPxiels [i] [1] 
rgbPxiels [i] [2 
} 

// filter max value 

for (int i=0; i<rgbPxiels.length; i++) 

{ 

maxRed = Math.max (maxRed, rgbPxiels[i][0]) ; 
maxGreen - Math.max (maxGreen, rgbPxiels [i] [1 Ds 
maxBlue = Math.max (maxBlue, rgbPxiels[i][2]) ; 


(int) (rgbPxiels[i][0] - minRed) ; 
(int) (rgbPxiels[i][1] - minGreen) ; 
(int) (rgbPxiels[i][2] - minBlue) ; 


} 

for (int i=0; i<rgbPxiels.length; i++) 

{ 
rgbPxiels [i] [0 
rgbPxiels[i] [1] 
rgbPxiels [i] [2 

} 


(int) (rgbPxiels[i][0] * (255/maxRed) ) ; 
(int) (rgbPxiels[i][1] * (255/maxGreen) ) ; 
(int) (rgbPxiels[i][2] * (255/maxBlue) ) ; 


井 行 直 方 图 像素 拉 伸 操作 时 ， 首 先 要 获取 图 像 的 直方 图 ， 根 据 直 方 图 选 定 图 像 最 大 与 最 小 值 之 后 ， 计 算 取 值 空间 s = max-min ， 然 后 根据 像素 值 pixel|， 如 果 大 于 等 于 max 则 赋值 255， 如 果 小 于 等 于 min 
则 取 值 0， 其 他 情况 下 ， 根 据 newPixel= ( (pixel-min) /s) x255 公 式 得 到 值 ， 此 值 即 为 拉 伸 之 后 的 像素 值 。 实 现 像 素 直 方 图 拉 伸 的 代码 如 下 : 


// 像素 的 直方 图 拉 仲 

int min = 55; 

int max = 200; 

float dynamic = max - min; 

for (int i-0; i<inPixels.length; i++) 
{ 


f (outPixels[i] [0] >= 200) 


ma H- 


outPixels[i] [0] = 255; 
} 


else 


outPixels[i][0] = (outPixels[i][0] <= min) ? 0: 
(int) ( ( (outPixels [i] [0]-min) /dynamic) * 255.0f) < 


f (outPixels[i][1] >= 200) 


=~ H- 


outPixels[i][1] = 255; 
} 

else 

{ 
outPixels [i] [1] 


= (outPixels[i][1] <= min) ? 0: 
(int) ( ( (outPixels[i] [1 


] -min) / dynamic) * 255.0£) ; 


} 
f (outPixels[i] [2] >= 200) 


a H- 


outPixels[i] [2] = 255; 
} 


else 


outPixels[i][2] = (outPixels[i][2] <= min) ? 0: 
(int) ( ( (outPixels [i] [2]-min) /dynamic) * 255.0f) ; 


) 


基于 拉 普 拉 斯 算 子 的 图 像 铝 化 完整 的 源 代码 LaplacianSharpenFilterjava 请 下 载 阅览 ， ee 在 第 8 章 的 源 代 码 包 中 。 这 里 要 特别 说 明 的 是 ， 最 后 一 步 中 ， 直 方 图 拉 伸 最 大 与 最 小 值 选 
择 ， 是 前 面 介绍 的 直方 图 知识 的 运用 ， 这 里 不 再 歼 述 。 而 且 在 图 像 锐 化 时 ， 如 果 没 有 必要 ， 后 一 步 是 可 以 省 去 的 ， 这 取决 于 实际 项 目 对 处 理 以 后 图 像 的 要 求 。 最 后 看 一 下 基于 拉 普 拉 斯 图 像 锐 化 之 后 与 
之 前 的 效果 对 比 ， 如 图 8-6 所 示 。 


很 显然 ， 处 理 之 后 的 图 像 显 示 了 更 多 的 细节 。 使 用 LaplacianSharpenFilter 类 只 需要 如 下 几 行 代码 即 可 : 


UR 处 理 之 后 


A8-6 ”效果 对 比 图 


LaplacianSharpenFilter filter = new LaplacianSharpenFilter () ; 
destImage = filter.filter (sourceImage, null) ; 


唯一 需要 注意 的 是 ， 不 同 的 图 像 直方 图 拉 伸 的 最 大 最 小 值 是 不 一 样 的 ， 要 根据 实际 图 像 的 直方 图 来 确定 。 


8.8 人 小结 


本 章 由 浅 入 深 地 介绍 了 卷 积 基 本 数学 知识 、 基 本 流程 、 图 像 卷 积 的 各 种 卷 积 核 (AT) 的 应 用 ， 重 点 介绍 了 图 像 模糊 算法 ， 基 于 窗口 移动 的 快速 卷 积 算法 ， 以 及 边缘 保留 的 图 像 模 糊 方法 。 在 学 习 这 些 
知识 的 基础 上 ， 进 一 步 展 开 了 卷 积 滤波 的 概念 ， 介 绍 了 基于 统计 滤波 实现 图 像 去 噪声 的 基本 方法 与 流程 ， 最 后 介绍 了 基于 拉 普 拉 斯 算 子 实现 的 图 像 卷 积 及 其 应 用 来 实现 图 像 钢 化， 提升 图 像 的 细节 特征 。 


本 章 内 容 同 样 涉及 一 些 基本 的 数学 知识 ， 其 中 最 重要 的 是 关于 卷 积 的 定义 ， 以 及 离散 卷 积 。 其 次 是 导数 的 概念 、 一 阶 与 二 阶 导数 在 离散 点 的 计算 技巧 ， 最 后 是 图 像 像 素 值 处 理 问 题 一 一 如 何 控制 图 像 像 
素 值 在 0~255 之 间 。 希 望 读者 在 学 习 本 章 内 容 的 同时 ， 阅 读 了 解 更 多 的 相关 数学 知识 ， 进 一 步 巩固 、 加 深 对 本 章 内 容 的 理解 。 


第 9 章 ” 边 绿 检测 与 提取 


第 8 章 介 绍 了 卷 积 及 其 相关 的 一 些 重要 应 用 知识 ， 本 章 继续 基于 卷 积 的 应 用 知识 ， 介 绍 基于 图 像 空 间 域 边 缘 检 测 的 基本 概念 、 常 用 的 边缘 检测 滤波 算 子 、 完 整 基 于 Canny 算 法 的 图 像 边 缘 检测 与 提取 算法 
的 实现 等 。 首先 从 基本 概念 入 手 ， 前 述 什 么 是 图 像 的 边缘 ， 图 像 边缘 有 哪些 明显 数学 特征 ， 然 后 介绍 如 何 利用 卷 积 算 子 实现 这 些 特征 的 提取 与 无 关 噪声 的 去 除 。 


同样 本 章 也 会 穿插 着 介绍 一 些 必 要 的 数学 知识 ， 帮 助 读者 厘清 边缘 提取 所 需 数学 知识 。 和 希望 大 家 在 学 习 图 像 处 理 知识 的 同时 ， 加 强 相 关 数 学 知识 学 习 ， 不 断 提 高 自己 利用 数学 知识 解决 图 像 处 理 实 际 问 
题 的 能 力 。 同 时 再 次 强调 一 下 ， 本 书 注重 实践 ， 源 代码 也 是 本 书 的 一 部 分 ， 请 认真 仔细 阅读 ， 运 行 与 修改 。 


9.1 什么 是 图 像 的 边 绿 


在 探讨 天 于 图 像 边 缘 的 概念 之 前 ， 首 先 来 看 一 幅 灰 度 图 像 及 其 对 应 直方 图 ， 如 图 9-1 所 示 。 


0 127 225 


图 9-1 边缘 直方 图 


显然 从 像素 值 的 强度 看 ， 值 为 0 的 像素 出 现 的 频率 最 高 ， 其 次 是 值 为 127 的 像素 。 从 图 像 上 也 可 以 观察 到 ， 从 左 到 右 ， 当 颜色 从 灰 度 变 为 黑色 时 ， 像 素 值 发 生变 化 ， 而 当 从 黑色 变 为 灰 度 时 ， 像 素 值 再 次 
发 生变 化 ， 其 他 情况 下 像素 值 没有 变化 ， 显 然 那些 像素 值 显著 变化 的 区 域 就 是 矩形 的 边缘 。 


边缘 一 般 出 现在 图 像 两 个 区 域 交 界 处 ， 这 些 边 界 处 同时 也 是 像素 值 发 生 很 大 变化 的 地 方 。 一 般 情 况 下 图 像 局 部 区 域 的 像素 发 生 很 大 变化 有 如 下 一 些 原因 
> 图 像 中 各 种 物理 物体 的 边界 。 

:图像 中 有 物理 物体 的 阴影 ， 或 者 光照 与 反射 等 。 

- 各 种 物理 事件 。 

通常 ， 我 们 把 图 像 像素 发 生 很 大 变化 的 区 域 称 为 边缘 区 域 (注意 此 边缘 不 是 普通 理解 的 边缘 ) ， 把 通过 一 系列 操作 得 到 边缘 过 程 称 为 边缘 提取 或 边缘 检测 。 
1. 边 缘 描述 与 常见 边缘 模型 

如 何 准 确 表 述 图 像 边 缘 的 特征 也 是 边缘 提取 中 十 分 重要 的 一 环 ， 通 常 通过 下 面 几 个 概念 来 描述 图 像 边 缘 特征 。 

` 边缘 法 线 : 单位 向 量 在 该 方向 上 图 像 像素 强度 变化 最 大 。 


: 边缘 方向 : 与 边缘 法 线 重 直 的 向 量 方向 。 


` 边缘 位 置 或 者 中 心 : 图 像 边缘 所 在 位 置 。 

` 边缘 强度 : 跟 沿 法 线 方向 的 图 像 局 部 对 比 相关 ， 对 比 越 大 ， 越 是 边缘 。 
这 里 的 法 线 指 的 是 平面 几何 中 所 说 的 过 切 点 的 垂直 于 切线 的 直线 ， 准 确 表示 如 图 9-2 所 示 。 
图 像 边缘 本 身 依 照 灰 度 强 度 变 化 可 以 分 为 如 下 几 种 边缘 模型 。 


跃迁 边缘 是 指 图 像 灰 度 强度 值 突然 发 生 很 大 变化 ， 从 一 个 值 突然 变化 到 另外 一 个 相差 很 大 的 值 ， 中 间 没 有 连续 强度 值 变化 。 常 见 的 跃迁 边缘 灰 度 强 度 值 变化 如 图 9-3 所 示 。 


图 9-2 边缘 表示 


理 相 情 况 下 
跃迁 边缘 模型 


斜坡 边缘 


图 9-3 各 种 边缘 类 型 
跟 上 述 的 跃迁 边缘 类 似 ， 只 是 图 像 灰 度 强度 变化 不 是 突然 友 生 而 是 一 个 连续 变化 的 过 程 。 


BRR 


图 像 像素 灰 度 强度 变化 突然 发 生 跃 迁 变化 之 后 ， 保 存 该 强度 一 段 距 离 ， 然 后 又 变化 为 原来 像素 的 灰 度 强度 。 图 9-4 形 象 地 说 明了 图 像 屋 脊 边缘 。 


理想 情况 下 "m 


图 9-4 JR 


2. 边 缘 检 测 原理 与 步骤 


在 了 解 了 图 像 边缘 各 种 特征 之 后 ， 寻 找 图 像 边 缘 就 变 成 如 何 通 过 计算 寻找 那些 像素 发 生变 化 的 区 域 了 ， 然 后 通过 进一步 处 理 即 可 得 到 图 像 边缘 ， 计 算 图 像 像素 之 间 的 变化 可 以 通过 数学 上 的 一 阶 导 数 来 
实现 ， 这 里 所 说 的 图 像 都 是 2D 图 像 ， 所 以 一 阶 导数 分 别 在 两 个 方向 实现 ， 又 称 为 X 或 Y 方 向 的 一 阶 偏 导 数 。 假 设 一 幅 数 字 图 像 可 以 表示 为 


SUE QU "| m= E - 
m i m "u 2 
r= 
其 X 与 Y 方 向 的 一 阶 偏 导 数 可 以 表示 为 : 
of . f(xc4-h.vy) —f(x.v n -A l uu 
af = ey) fey ty) Ta). fix -l,y) —f(x,y) ,1& ix h = 1] 
cx EO h T Jj : 


of | f( A , i T h ) B Í ( A " y) P ; i" ditt >H 
=< = hme = flay +1) -—flayy) ae h — 1 
Ov h- 20 h : : = : 
通过 求 取 图 像 在 X 与 Y 方 向 的 一 阶 导 数 ， 就 可 以 找到 图 像 的 边缘 区 域 ， 完 成 对 图 像 的 边缘 检测 ， 进 一 步 处 理 以 后 就 可 以 实现 图 像 边缘 提取 。 通 常 一 个 完整 的 图 像 边缘 检测 的 流程 要 包括 如 下 几 步 : 
1) 模糊 预 处 理 ， 目 的 是 降低 噪声 对 图 像 边缘 检测 的 干扰 。 
2) 铅 化 提升 ， 提 高 图 像 边 缘 对 比 度 。 
3) 边缘 检测 ， 寻 找 图 像 边缘 区 域 。 


4) 边缘 像素 定位 ， 目 的 是 从 边缘 区 域 中 去 掉 那 些 非 边缘 像素 。 


本 节 主 要 介绍 了 图 像 边 缘 的 基本 概念 与 特征 ， 边 缘 检测 的 基本 原理 与 手段 ， 下 面 将 深入 细 化 这 些 内 容 。 


9.2 Robot 算 子 与 轧 化 效果 


前 面 一 节 介 绍 了 图 像 边 缘 的 特征 ， 而 Robot 算 子 就 是 检测 图 像 边缘 的 卷 积 核 (AF) ， 而 且 Robot 算 子 是 从 水 平 45" 或 135" 两 个 方向 进行 图 像 边缘 的 寻找 的 ，Robot 算 子 对 于 跃迁 边缘 有 着 非常 好 的 效 
果 。Robot 算 子 的 表示 如 下 : 


= 2- 
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Robot 算 子 及 其 他 2x2 算 子 对 图 像 噪声 非常 敏感 ， 换 句 话说 就 是 当 图 像 有 噪声 干扰 时 ，Robot 算 子 边 缘 检测 效果 将 会 大 打折 扣 。 基 于 图 像 的 Robot 算 子 A 或 B 得 到 的 图 像 与 原 图 像 相 比 ， 看 上 去 好 像 有 立 
体 轧 伦 的 效果 。 基 于 Robot 算 子 图 像 边 缘 的 检测 效果 如 图 9-5 所 示 。 


Robot 算 子 B 结 果 


图 9-5 ”Robot 算 子 效 果 


从 上 述 结果 可 以 看 出 ，A 与 B 算 子 分 别 对 斜 上 方 与 斜 下方 的 边缘 检测 效果 比较 明显 。 完 整 的 程序 实现 Robot 算 子 边缘 检测 的 代码 如 下 : 


package com.book.chapter.nine; 
import java.awt.image.BufferedImage; 
import com.book.chapter.four.AbstractBufferedImageOp; 
public class RobotFilter extends AbstractBufferedlImageOp { 
private boolean useA = true; 
public RobotFilter () 
{ 


} 
public boolean isUseA () | 
return useA; 


System.out.println ("Robot Filter") ; 


} 

public void setUseA (boolean useA) { 
this.useA = useA; 

} 


@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 
// 初 始 化 ， 获 取 输 入 图 像 像素 数组 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 
getRGB (src, 0, 0, width, height, inPixels) ; 
// 每 一 行 、 每 一 列 循环 每 个 像素 
int index = 0; 
for (int row = 0; row < height; rowt+) { 
int ta = 0, tr 0, tg=0, tb= 0; 
for (int col = 0; col < width; col++) { 


index = row * width + col; 
// 计算 Robot 算 子 ， 使 用 A 模板 


if (isUseA () ) 
{ 
int[] rgbl = getPixel (inPixels, width, height, col, row) ; 
int[] rgb2 = getPixel (inPixels, width, height, col+l, rowt1l) ; 
tr = rgb1[0] - rgb2[0]; 
tg = rgbl[1] - rgo2[1]; 
tb = rgbl[2] = rgb2[2]; 
} 
else 
( // 4% Robot $F BRR 
int[] rgbl = getPixel (inPixels, width, height, col+l, row) ; 
int[] rgb2 = getPixel (inPixels, width, height, col, row*l) ; 
tr = rgbl[0] - rgb2[0]; 
tg = rgbl[l] = rgo2[1]i 
tb = rgbl1[2] - rgb2[2]; 
} 
// clamp 来 处 理 计 算 后 的 结果 
outPixels[index] = (ta << 24) | (clamp (tr) «« 16) | (clamp (tg) «« 8) | clamp (tb) ; 
} 
} 
setRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 
} 
private int[] getPixel (int[] inPixels, int width, int height, int col, 
int row) + 
if (col < 0 || col >= width) 
col = 0; 
if (row « O || row »- height) 
row = 0; 
int index = row * width + col; 
int tr = (inPixels [index] >> 16) & Oxff; 
int tg = (inPixels[index] >> 8) & Oxff; 
int tb = inPixels[index] & Oxff; 
return new int[]{tr, tg, tb); 


需要 特别 注意 的 是 ， 这 里 用 到 两 个 像素 值 相 减 ， 得 到 的 结果 可 能 不 在 0~255 之 间 ， 这 个 时 候 必 须 调用 clamp () 函数 处 理 计算 后 的 结果 。 源 代码 中 已 经 加 上 了 注释 ， 和 希望 读 者 阅读 代码 ， 理 解 与 运 


9.3 Sobel 算 子 与 Prewitt 算 子 


Sobel 算 子 与 Prewitt 算 子 都 是 3x 3 的 算 子 ， 假 设 有 如 下 的 像素 块 M : 
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M,=(a2+ca3+a4)—(a0+ca7+a6) 
M,=(a6+ea5+a4)—(a0+ca1+a2) 
E MEM 
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基于 Prewitt 算 子 在 X 与 Y 方 向 卷 积 之 后 得 到 的 图 像 效 果 如 图 9-6 所 示 。 


基于 Sobe| 算 子 在 X 与 Y 方 向 卷 积 之 后 得 到 的 图 像 效果 如 图 9-7 所 示 。 


基于 Sobel 与 Prewitt 算 子 边缘 检测 的 完整 代码 如 下 : 


Prewitt AT X Jj mn] 


图 9-6 ”Prewitt 算 子 效果 


Lo 
Li F T @, 


AT X 方 向 边缘 检测 


图 9-7 Sobel 算 子 效果 


| Sobel 算 子 Y 方 向 边缘 检测 


package com.book.chapter.nine; 
import java.awt.image.BufferedImage; 
import com.book.chapter.four.AbstractBuf 


= 


eredImageOp; 


public class SobolPrewittEdgeDetector extends AbstractBufferedImageOp { 
public final static int SOBOL TYPE = 1; 
public final static int PREWITT TYPE = 2; 
public final static int X DIRECTION = 4; 
public final static int Y DIRECTION = 8; 
private int type; 
private int direction; 
public SobolPrewittEdgeDetector () 
{ 
type = PREWITT TYPE; 


direction = X DIRECTION; 


lic int getType () { 
return type; 


oe 
on 


} 
public void setType (int type) { 
this.type = type; 


} 
public int getDirection () { 
return direction; 


} 
public void setDirection (int direction) { 
this.direction = direction; 


QOverride 


public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 


if (dest == null) 


dest = createCompatibleDestImage (src, null) ; 
// 初 始 化 ， 获 取 输 入 图 像 像 素数 组 


int[] inPixels = new in 


int[] outPixels = 
getRGB (src, 0, 


t[width * height]; 


new int[width * height]; 


0, width, height 


// 每 一 行 、 每 一 列 的 循环 每 个 像素 


int index = 0; 


// 确定 是 否 为 Sobol 算 子 


int coefficient 


, inPixels) ; 


(getType () == SOBOL TYPE) ? 2: 1; 


for (int row - 0; 


row < height; rowt+) { 


int ta = 0, 
for (int col 


tr = 0, tg =0, 


tb = 0; 


= 0; col < width; colt+) 1 


index = row * width + col; 
// X 方 向 边缘 检测 


if (getDirection () == . DIRECTION) 
{ 
int[] a2 = getPixel (inPixels, width, height, col+l, row-1) ; 
int[] a3 = getPixel (inPixels, width, height, col+l, row) ; 
int[] a4 = getPixel (inPixels, width, height, col+l, rowt1l) ; 
int[] a0 = getPixel (inPixels, width, height, col-1, row-1) ; 
int[] a7 = getPixel (inPixels, width, height, col-1, row) ; 
int[] a6 = getPixel (inPixels, width, height, col-1, rowt1l) ; 
tr = (a2[0] + coefficient * a3[0] + a4[0]) - (a0[0] + coefficient * a7[0] + a6[0]) ; 
tg = (a2[1] + coefficient * a3[1] + a4[1]) - (a0[1] + coefficient * a7[1] + a6[1]) ; 
tb = (a2[2] + coefficient * a3[2] + a4[2]) - (a0[2] + coefficient * a7[2] + a6[2]) ; 
} 
else 
{ // Y 方 向 边缘 检测 
int[] a6 = getPixel (inPixels, width, height, col-1, rowt1l) ; 
int[] a5 = getPixel (inPixels, width, height, col, rowtl) ; 
int[] a4 = getPixel (inPixels, width, height, col+l, row-*l) ; 
int[] a0 = getPixel (inPixels, width, height, col-1, row-1) ; 
int[] al = getPixel (inPixels, width, height, col, row-1) ; 
int[] a2 = getPixel (inPixels, width, height, col+l, row-1) ; 
tr = (a6[0] + coefficient*a5[0] + a4[0]) - (a0[0]+coefficient*al[0]+a2[0]) ; 
tg = (a6[1] + coefficient*a5[1] + a4[1]) - (a0[1]+coefficient*al[1]+a2[1]) ; 
tb = (a6[2] + coefficient*a5[2] + a4[2]) - (a0[2]+coefficient*al[2]+a2[2]) ; 
} 
// clamp 来 处 理 计 算 后 的 结果 
outPixels[index] = (ta << 24) | (clamp (tr) «« 16) | (clamp (tg) «« 8) | clamp (tb) ; 


} 


SetRGB (dest, 0, 
return dest; 


private int[] getPixel 


A. 


其 中 参数 type 选 择 Soble 算 子 类 型 或 Prewitt 算 子 


0, width, height, outPixels) ; 


(int[] inPixels, 


int width, int height, int col, 


int row) { 


if (col < 0 || col >= width) 

col = 0; 
if (row < 0 || row >= height) 

row = 0; 
int index = row * width + col; 
int tr = (inPixels[index] >> 16) & Oxff; 
int tg = (inPixels[index] >> 8) & Oxff; 
int tb = inPixels[index] & Oxff; 
return new int[]{tr, tg, tb}; 

SKA 


AE, 


SobolPrewittEdgeDetector filter = new SobolPrewittEdgeDetector () ; 


参数 direction 决 定 是 进行 X 方 向 边缘 检测 还 是 Y 方 向 边缘 检测 。 运 行 与 测试 SobolPrewittEdgeDetector 类 时 


ae 
, RES 


要 如 下 几 行 代码 即 可 : 


ilter.setType (SobolPrewittEdgeDetector.SOBOL TYPE) ; 
filter.setDirection (SobolPrewittEdgeDetector.Y DIRECTION) ; 
destImage = filter.filter (sourceImage, null) ; 
仔细 观察 运行 效果 图 ， 发 现 X 方 向 与 Y 方 向 的 边缘 恰好 形成 完整 的 图 像 边 缘 区 域 ， 基 于 X 与 Y 方 向 边缘 检测 结果 ， 如 何 得 到 完整 图 像 边缘 区 域 将 在 下 一 节 中 详细 讨论 。 


9.4 图像 梯 度 一 一 大 小 与 角度 


前 面 已 经 通过 基于 X 与 Y 方 向 的 算 子 得 到 了 图 像 X 方 向 与 Y 方 向 的 一 阶 偏 导数 的 结果 Mx 与 My。 在 此 基础 上 ， 可 以 得 到 图 像 的 梯度 : 


其 中 梯度 大 小 可 以 表示 为 : 

| um == -j 7 i, = 
i a [| | ga [E — 
maen T) -— 4 = 
L. 1 Li r A i 2 3 = 
N \ dx o 
梯度 方向 表示 为 : "(D = tan ( M/M,) 

根据 前 面 学 到 的 知识 ，Mx 与 My 可 以 通过 Sobe| 或 Prewitt 算 子 计算 得 到 。 进 而 可 以 计算 得 到 每 个 像素 的 梯度 值 ， 其 中 大 小 表示 边缘 的 强度 ， 方 向 表示 边缘 的 方向 。 很 显然 ， 对 一 幅 图 像 来 说 ， 计 算得 到 
边缘 。 所 以 通过 梯度 检测 图 像 边缘 的 算法 ， 很 多 时 候 最 后 一 步 就 是 选取 合适 的 阔 值 T 来 去 掉 非 边缘 像素 。 完 整 的 基于 图 像 梯 度 边 缘 提 取 算 法 步骤 


的 梯度 大 小 magn (vf) 值 只 有 大 于 某 个 辣 值 TH 时候 才 可 能 


如 下 : 
1) 计算 图 像 X 方 向 与 Y 方 向 的 一 阶 偏 导 数 Mx 与 My 


2) 根据 第 一 步 计算 结果 计算 图 像 梯度 。 
使 用 阔 值 细 化 边缘 时 ， 首 先 需要 把 图 像 变 成 灰 度 图 像 ， 然 后 选择 T = 127 作 为 冰 值 来 细 化 边缘 。 基 于 上 述 步骤 实现 边缘 提取 的 效果 如 图 9-8 所 示 。 


3) 使 用 立 值 T 细 化 边缘 。 


根据 上 述 基 于 图 像 梯度 边缘 提取 算法 的 步骤 ， 其 中 第 一 步 及 其 代码 的 实现 已 经 在 前 面 详细 论述 ， 第 二 步 计 算 图 像 梯度 与 第 三 步 选 择 阔 值 T 细 化 边缘 在 GradientEdgeFilter 类 中 实现 的 完整 源 代 码 如 下 : 


package com.book.chapter.nine; 


import java.awt.image.BufferedImage; 

public class GradientEdgeFilter extends SobolPrewittEdgeDetector { 
private int threshold = 127; 
public GradientEdgeFilter () 
{ 


} 
public int getThreshold () { 
return threshold; 


System.out.println ("AiR E 3n EXUEhttp: //www.hzcourse.com/resource/readBook?path=/openresources/teach_ebook/uncompressed/15509/OEBPS/Text/...") ; 


} 
public void setThreshold (int threshold) { 
this.threshold = threshold; 


} 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
BufferedImage xImage = super.filter (src, null) ; 

this.setDirection (Y DIRECTION) ; 

fferedImage yImage = super.filter (src, null) ; 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 


dest = createCompatibleDestImage (src, null) ; 
int[] dxPixels = new int[width * height]; 
int[] dyPixels = new int[width * height]; 
int[] outPixels new int[width * height]; 


, 0, width, height, dxPixels) ; 
, 0, width, height, dyPixels) ; 


tRGB (yImage, 
int index - 0; 
double mred, mgreen, mblue; 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 


getRGB (xImage, 0 
z 0 


int ygreen = (dyPixels[index] >> 8) & Oxff; 
int yblue = dyPixels[index] & Oxff; 
// 计算 梯度 大 小 

mred = Math.sqrt (xred * xred + yred * yred) ; 

mgreen = Math.sqrt (xgreen * xgreen + ygreen * ygreen) ; 
mblue = Math.sqrt (xblue * xblue + yblue * yblue) 
// 得 到 图 像 梯 度 值 

int tr = clamp ( (int) mred) ; 

int tg = clamp ( (int) mgreen) ; 

int tb = clamp ( (int) mblue) ; 

outPixels[index] = (Oxff << 24) | (tr << 16) | (tg << 8) | tb; 
} 


} 

// ABA BAB 2n 63h 

for (int row = 0; row < height; rowt+) { 

for (int col = 0; col < width; col++) { 
index = row * width + col; 


int xred = (dxPixels[index] >> 16) & Oxff; 

int xgreen = (dxPixels[index] >> 8) & Oxff; 
int xblue = dxPixels[index] & Oxff; 

int yred = (dyPixels [index] >> 16) & Oxff; 


b 


int tr = (outPixels[index] »» 16) & Oxff; 
int tg = (outPixels[index] >> 8) & Oxff; 
int tb = outPixels[index] & Oxff 


tr = tg = tb = (int) (0.299 * (double) tr + 0.587 * (double) tg + 0.114 * (double) tb) ; 
if (tr « threshold || tg « threshold || tb « threshold) 


tr = tg = tb = 0; 


else 


tr = tg = tb = 255; 


outPixels [index] = (Oxff << 24) | (tr << 16) | (tg << 8) | tb; 
} 
} 
SetRGB (dest, 0, 0, width, height, outPixels ) ; 
return dest; 


关于 图 像 梯度 中 角度 属性 的 使 用 将 在 后 面 的 内 容 中 介绍 ， 本 节 暂 不 讨论 。 本 节 详 细 地 阐述 了 基于 图 像 一 阶 导 数 实现 图 像 梯度 大 小 与 角度 计算 完成 图 像 边 缘 提 取 的 方法 ， 最 后 一 步 如 何 细 化 边缘 有 很 多 种 
方法 ， 后 面 的 内 容 将 陆续 介绍 。 


9.5 ”基于 二 阶 导数 的 图 像 边 绿 提取 


本 节 继 续 学 习 图 像 边缘 提取 方法 ， 不 止 是 基于 一 阶 导数 可 实现 图 像 梯 度 的 计算 与 边缘 的 提取 ， 同 样 ， 二 阶 导 数 也 可 以 实现 图 像 边缘 提取 。 假 设 图 像 边缘 可 以 用 遂 数 f(x) 表示 为 如 图 9-9 所 示 的 形式 。 


fix) 


图 9-9 ”边缘 函数 


f") 


图 9-10 ”对 于 一 阶 与 二 阶 导数 结果 


其 对 应 图 像 边 缘 的 一 阶 与 二 阶 导数 则 如 图 9-10 所 示 。 
图 像 在 X 方 向 的 二 阶 导数 可 以 表示 为 : 

aro | 

( a oy , — : ni | X l T | 

guy) t: y) = f (Ry) =J œ + ly) =f (zy) = fer liy) -2f(x,y) F(x — 11,7) 

d xX 

对 应 的 卷 积 算 子 可 以 表示 为 [1 -2 1) 


图 像 在 Y 方 向 的 二 阶 导 数 可 以 表示 为 : 


s 
H (x.y er | a ! " " — is 
AY = pny) = fly +1) fly) = flay +1) - ny) + flay 1) 
X. j 2 ; ‘ , : - | ; 
| | 
对 应 的 卷 积 算 子 可 以 表示 为 | 


完整 的 拉 普 拉 斯 二 阶 导数 可 以 表示 为 : ”“ 


其 对 应 的 卷 积 算 子 表示 为 : 


基于 该 算 子 的 几 种 常见 变种 的 拉 普 拉 斯 算 子 如 下 : 


| -2 | Ü -1 U -] -1 -| 


— 2 4 一 -< — | 4 一 — | 8 -—] 
| 2 | U 一 ] U -] -1 -1 


要 一 个 算 子 即 可 完成 ， 比 基于 一 阶 导 数 的 边 图 像 梯度 缘 提取 计算 量 少 ， 但 是 二 阶 导 数 提取 图 像 边 缘 不 提供 边缘 方向 信息 ， 而 且 二 阶 导 数 边缘 提 
导数 提取 之 前 ， 首 先 会 对 图 像 进行 低 通 滤波 (模糊 ) ， 且 选择 的 低 通 滤波 器 为 高 斯 滤波 器 (高 斯 模糊 ) 。 从 数字 信号 处 理 角度 看 ， 图 像 中 
才 高 斯 模糊 就 是 要 消除 低频 信号 对 图 像 高 频 信号 的 影响 。 高 斯 模糊 之 后 ， 图 像 再 进行 拉 普 拉 斯 算 子 的 卷 积 计算 即 可 得 到 图 像 边缘 ， 在 图 像 


拉 普 拉 斯 高 斯 的 数学 公式 可 以 表示 为 : 


从 上 面 可 以 看 出 ， 基 于 二 阶 导数 实现 的 图 像 边缘 提取 只 需 
取 对 图 像 质量 有 要 求 ， 对 有 噪声 的 图 像 效 果 不 佳 。 所 以 通常 用 
的 各 种 细节 信息 都 属于 低频 信号 ， 而 边缘 等 轮廓 属于 高 频 信 息 ， 通 过 
处 理 中 把 这 两 步 合 并 起 来 ， 称 为 拉 普 拉 斯 高 斯 (LOG-Laplacian of Gaussian) , 


[fxsy) # G(x,y)] = V G(x,y) *f(x,y) 


， 其 中 表示 高 斯 核 ( 算 子 ) 的 半径 ， 值 越 大 ， 高 斯 模糊 的 程度 也 越 厉害 。 一 个 常见 的 LOG 算 子 如 下 所 示 : 


2 
m r/2g 


其 中 v2G (x, y) = o qty, 


| 
U — | U 


基于 二 阶 导 数 提取 图 像 边 缘 的 原理 部 分 大 致 如 此 ， 本 节 中 编程 实现 基于 二 阶 导数 的 边缘 提取 完整 步骤 如 下 : 


1) 获取 像素 数组 ， 进 行 高 斯 模糊 处 理 ， 得 到 模糊 之 后 的 图 像 。 
2) 基于 拉 普 拉 斯 算 子 完成 边缘 提取 。 

3) 基于 像素 最 小 与 最 大 值 完成 灰 度 拉 伸 。 

4) 基于 阔 值 完成 二 值 化 ， 得 到 输出 结果 。 


基于 上 述 步骤 实现 图 像 边缘 提取 效果 如 图 9-11 所 示 。 


图 9-11 拉 普 拉 斯 提取 


其 中 第 一 步 高 斯 模糊 在 第 8 章 中 已 经 详细 解释 过 ， 这 里 不 再 做 歼 述 ， 完 整 的 基于 拉 普 拉 斯 算 子 的 图 像 二 阶 导 数 边缘 的 提取 代码 如 下 : 


package com.book.chapter.nine; 
import java.awt.image.BufferedImage; 
import com.book.chapter.eight.GaussianBlurFilter; 
public class LaplacianFilter extends GaussianBlurFilter { 
public final static int[][] LAPLACIAN OPERATOR = new int[][]{{0, 1, 0), (1, -4, 1), (0, 1, O}}; 
@Override 7 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 


// 5x5 高 斯 模糊 窗口 

this.setN (2) ; 

this.setSigma (2) ; 

BufferedImage smoothedImage = super.filter (src, null) ; 


// 拉 普 拉 斯 算 子 提取 边缘 


int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 
getRGB (smoothedImage, 0, 0, width, height, inPixels) ; 
int index = 0; 
int indexl = 0; 
int sumRed = 0, sumGreen = 0, sumBlue = 0; 
ts 


int subSize = LAPLACIAN OPERATOR.length/2; 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
for (int subRow--subSize; subRow<=subSize; subRow++) 


{ 


int nrow = row + subRow; 
f (nrow < 0 || nrow >= height ) 


ma H- 


nrow = 0; 
} 
for (int subCol--subSize; subCol<=subSize; subCol++) 


{ 


int ncol = col + subCol; 
f (ncol < 0 || neol >= width) 


=~ H- 


ncol = 0; 
} 


indexl = nrow * width + ncol; 


int tr = (inPixels[indexl] >> 16) & Oxff; 
int tg = (inPixels[indexl] >> 8) & Oxff; 
int tb = inPixels[indexl] & Oxff; 


// 提取 边缘 

sumRed = sumRed + (tr * LAPLACIAN OPERATOR[subRow + subSize][subCol + subSize]) ; 
sumGreen = sumGreen + (tg * LAPLACIAN OPERATOR[subRow + subSize][subCol + subSize]) ; 
sumBlue = sumBlue + (tb * LAPLACIAN OPERATOR[subRow + subSize] [subCol + subSize]) ; 


} 
} 
// clamp 来 处 理 计算 后 的 结果 


outPixels[index] = (Oxff << 24) | (clamp (sumRed) << 16) | (clamp (sumGreen) << 8) | clamp (sumBlue) ; 
// 重 置 为 下 个 像素 计算 结果 
sumRed = 0; 


sumGreen = 0; 
sumBlue - 0; 


) 
) 
// 图 像 灰 度 化 ， 寻 找 最 大 最 小 灰 度 值 


float min = 255, max = 0; 

for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 


int tr = (outPixels[index] >> 16) & Oxff; 
int tg = (outPixels[index] >> 8) & Oxff; 


int tb = outPixels[index] & Oxff; 
tr = tg = tb = (int) (0.299 * (double) tr + 0.587 * (double) tg + 0.114 * (double) tb) ; 


min = Math.min (min, tr) ; 
max = Math.max (max, tr) ; 
outPixels [index] = (Oxff << 24) | (tr << 16) | (tg << 8) | tb; 


} 
} 
// 灰 度 拉 伸 


float scale = max - min; 
double sum = 0; 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
int gray = (outPixels[index] >> 16) & Oxff; 
if (gray >= max) 
{ 


gray = 255; 


else if (gray <= (min+4) ) // want to remove some noise 


{ 
} 


else 


{ 
} 


sum += gray; 
outPixels [index] = (Oxff << 24) | (gray << 16) | (gray << 8) | gray; 
} 


} 

// 简单 的 二 值 化 

int means = (int) (sum / outPixels.length) ; 
for (int i20; i«outPixels.length; i++) 


{ 


gray — 0; 


gray = (int) ( (gray-min) * (255.0f/scale) ) ; 


int gray = (outPixels[i] >> 16) & Oxff; 


if (gray <= means) 
{ 
gray = 0; 
} 
else 
{ 
gray = 255; 
} 
outPixels[i] = (Oxff << 24) | (gray << 16) | (gray << 8) | gray; 


SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 


本 节 与 前 一 节 中 完成 边缘 提取 以 后 ， 图 像 的 边缘 还 是 比较 宽 。 解 决 这 个 问题 有 两 种 方法 ， 一 种 是 通过 迭代 再 次 边缘 提取 来 细 化 边缘 ， 另 外 一 种 方法 是 采用 非 最 大 信号 压制 来 实现 。 下 一 节 中 将 详细 阐述 
非 最 大 信号 压制 方法 ， 至 于 迭代 方法 多 次 提取 边缘 实现 细 化 ， 希 望 读者 自己 实现 。 


9.6 经 典 边 缘 提 取 算 法 一 Canny Edge Detection 


本 节 介 绍 边缘 提取 经 典 算法 Canny 边 缘 检 测 ， 该 算法 是 在 1986 年 由 John F.Canny 开 发 出 来 的 ，Canny 边 缘 提 取 算 法 是 一 种 基于 梯度 计算 边缘 的 方法 ， 标 准 的 Canny 边 缘 提 取 算 法 包括 如 下 几 步 : 
1) 首先 将 图 像 转换 为 灰 度 图 像 。 

2) 通过 高 斯 模糊 卷 积 实现 降 噪 。 

3) 计算 图 像 梯 度 的 大 小 与 角度 。 

4) 非 最 大 信号 压制 。 


5) 双 阔 值 边缘 连接 。 


6) 二 值 化 图 像 显示 。 

下 面 将 逐一 分 析 各 个 步骤 的 基本 操作 及 其 代码 实现 。 

1. 灰 度 图 像 转换 

在 提取 边缘 之 前 ， 对 输入 的 彩色 图 像 进行 灰 度 转换 ， 将 图 像 从 RGB 色彩 空间 转换 到 值 在 0~ 255 之 间 的 灰 度 值 空间 中 。 实 现 图 像 像素 从 RGB 转换 到 灰 度 的 公式 如 下 : 
gray=RX0.209+GX0.587+BX0.114 


循环 每 个 输入 像素 获取 RGB 值 ， 将 计算 得 到 的 结果 作为 每 个 像素 的 输出 像素 ， 即 完成 了 图 像 灰 度 转换 ， 实 现 图 像 灰 度 转换 的 代码 如 下 : 


int[] inPixels = new int[width*height]; 
int[] outPixels = new int[width*height]; 
getRGB ( src, 0, 0, width, height, inPixels ) ; 
int index = 0; 
for (int row-0; row«height; rowt+) { 
int ta- 0, tr = 0; tg=0, to = 03 
for (int col=0; col«width; col++) { 
index = row * width + col; 


ta = (inPixels[index] >> 24) & Oxff; 
tr = (inPixels[index] >> 16) & Oxff; 
tg = (inPixels[index] >> 8) & Oxff; 
tb = inPixels[index] & Oxff 


int gray= (int) (0.299 *tr + 0.587*tg + 0.114*tb) ; 
outPixels[index] = (ta << 24) | (gray << 16) | (gray << 8) | gray; 


2. 高 斯 模糊 降 噪声 


Canny 边 缘 提 取 算 法 是 基于 梯度 计算 实现 的 边缘 计算 方法 ， 对 噪声 比较 敏感 ， 而 高 斯 模糊 的 目的 就 是 通过 图 像 在 空间 域 低 通 滤波 实现 噪声 降低 ， 从 而 减 小 噪声 干扰 。 该 步 可 以 用 公式 表达 如 下 : 


S(x - 2 rx ^ ’) A X. y) 


其 中 f (x, y) 表示 原 像素 点 集合 、S (X, y) 表示 处 理 以 后 的 像素 集合 。o 则 决定 高 斯 窗口 的 大 小 与 模糊 程度 。 计 算 生 成 高 斯 卷 积 核 的 代码 如 下 : 


// 计算 高 斯 卷 积 核 
float kernel[][] = new float[gaussianKernelWidth] [gaussianKernelWidth]; 
for (int x-0; x<gaussianKernelWidth; x++) 


{ 


for (int y-0; y<gaussianKernelWidth; y++) 
{ 


kernel [x] [y] = gaussian (x, y, gaussianKernelRadius) ; 


完成 像素 高 斯 卷 积 的 代码 如 下 : 


// 高 斯 模糊 一 灰 度 图 像 
int krr = (int) gaussianKernelRadius; 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
double weightSum = 0.0; 
double redSum = 0; 
for (int subRow--krr; subRow<=krr; SubRow++) 


{ 


int nrow = row + subRow; 
f (nrow >= height || nrow « 0) 


=~ H- 


nrow = 0; 


} 
for (int subCol--krr; subCol<=krr; subCol++) 
{ 


int ncol = col + subCol; 
f (ncol >= width || ncol <=0) 


Lu. 


{ 
} 


int index2 = nrow * width + ncol; 

int trl = (inPixels[index2] >> 16) & Oxff; 
redSum += trl*kernel[subRow-tkrr][subCol-tkrr]; 
weightSum += kernel [subRow+tkrr] [subColtkrr] ; 


ncol = 0; 


} 


int gray = (int) (redSum / weightSum) ; 
outPixels [index] = gray; 


因为 是 基于 灰 度 像素 值 的 ， 所 以 只 需要 计算 灰 度 值 模糊 即 可 。 通 过 高 斯 模糊 降 噪 以 后 ， 像 素数 据 就 可 以 进行 下 一 步 处 理 。 
3. 计 算 图 像 梯度 大 小 与 角度 


计算 梯度 主要 基于 图 像 在 X 方 向 与 Y 方 向 的 一 阶 偏 导数 实现 ， 公 式 表 述 如 下 : 
G (x,y) [S(x,y +1) - S(x,y) + S(x -* l,y * 1) - S(x * 1,y) |72 
G (x,y) = [LS(x,y) = S(x t 1,y) - S(x,y +1) - S(x + 1,y +1) |72 


根据 X 与 Y 方 向 的 梯度 可 以 计算 图 像 该 像素 点 的 梯度 幅 值 与 角度 : 


C(x,y 
O(x,Yy 


由 于 反 三 角 —À p 


// 计算 梯度 -gradient， X 方 向 与 Y 方 向 
data = new float[width * height]; 


IL 


i 


* 


Nja 


~ D 
JG, (x 


d. 
lan (G, 


| 为 了 便于 计算 ， 在 角度 值 上 面 加 上 TV/2， 从 而 使 角度 值 范围 在 [0"~180?] 之 间 。 计 算 图 像 梯度 及 根据 图 像 梯度 计算 图 像 幅 值 与 角度 的 代码 如 下 : 


magnitudes = new float[width * height]; 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
// 计算 X 方 向 梯度 
float xg = (getPixel (outPixels, width, height, col, Low+1) - 
getPixel (outPixels, width, height, col, row) + 
getPixel (outPixels, width, height, col4l, row+tl) - 
getPixel (outPixels, width, height, col+1， row) ) /2.0f; 
float yg = (getPixel (outPixels, width, height, col, row) - 
getPixel (outPixels, width, height, col+1, row) + 
getPixel (outPixels, width, height, col, row+l) - 
getPixel (outPixels, width, height, col+1， row+l) ) /2.0f; 


// 计算 振幅 与 角度 


data[index] = hypot (xg, yg) ; 
if (xg == 0) 
{ 

if (yg > 0) 

{ 


magnitudes [index] =90; 


f (yg < 0) 


a H- =~ 


magnitudes [index]=-90; 


} 


else if (yg == 0) 
magnitudes [index]=0; 


else 


{ 


magnitudes [index] = (float) 


} 
// make it 0 ~ 180 
magnitudes [index] += 90; 


( (Math.atan (yg/xg) 


* 180) /Math.PI) ; 


其 中 getPixel () 方法 是 获取 图 像 像素 值 。 计 算 了 图 像 梯度 幅 值 与 角度 之 后 ， 就 可 以 进行 下 一 步 的 处 理 了 。 


4. 非 最 大 信号 压制 


非 最 大 信号 压制 的 目的 是 获取 细 化 边缘 ， 其 大 致 思想 是 根据 角度 对 每 个 像素 幅 值 比较 同方 向 上 两 个 相 邻 的 像素 ， 如 果 小 于 其 中 任意 一 个 则 舍弃 ， 


1) 假设 3x3 的 像素 区 域 ， 中 心 像素 点 为 P(x，y) , 定义 四 个 离散 边缘 角度 0、45、90、135。 


2) 找 出 中 心 像素 角度 与 这 个 四 个 角度 最 相 邻 的 角度 。 


3) 根据 角度 方法 ， 比 较 中 心 像素 幅 值 与 相 邻 两 个 像素 是 否 为 最 大 ， 是 则 保留 ， 否 则 舍弃 。 


其 中 离散 角度 应 用 如 下 规则 计算 : 


. 如 果 角 度 的 值 在 0~22.5 或 157.5~180 度 之 间 ， 为 0。 


. 如 果 角 度 的 值 在 22.5~67.5 度 之 间 ， 为 45。 


- 如 果 角 度 的 值 在 67.5~112.5 度 之 间 ， 为 90。 


. 如 果 角 度 的 值 在 112.5~157.5 度 之 间 ， 为 135。 


非 最 大 信号 压制 的 实现 代码 如 下 所 示 : 


" 


Y) +G, 


,y)/G (x,y 


X 


否则 保留 。 其 算法 大 致 步骤 如 下 : 


// 非 最 大 信号 压制 算法 3x3 


Arrays.fill (magnitudes, 0) ; 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 


index = row * width + col; 
Float angle = magnitudes [index]; 
oat m0 = data[index] ; 


magnitudes [index] = m0; 
if (angle >=0 && angle < 22.5) // angle 
{ 
float ml = getPixel (data, width, 
float m2 = getPixel (data, width, 
if (mO < ml || mO < m2) 
{ 
magnitudes [index] = 0; 


else if (angle >= 22.5 && angle < 67.5) 


float ml = getPixel (data, width, 
float m2 = getPixel (data, width, 
if (m0 < ml || mO < m2) 
{ 

magnitudes [index] = 0; 


else if (angle >= 67.5 && angle < 112.5) 


float ml = getPixel (data, 
float m2 = getPixel (data, 
mO < m2) 


width, 
width, 


f (mO < ml 


a H- 


magnitudes [index] = 0; 


0 

height, col-1, row) ; 

height, col-41, row) ; 
// angle +45 

height, col41, row-1) ; 

height, col-1, Fow+1) ; 
// angle 90 

height, col, rowtl) ; 

height, col, row-1) ; 


else if (angle »-112.5 && angle « 157.5) // angle 135 / -45 


float ml = getPixel (data, width, height, col-1, row-1) ; 
float m2 = getPixel (data, width, height, col+l, row-*l) ; 
if (mO < ml || mO < m2) 
{ 

magnitudes [index] = 0; 


} 


else if (angle >=157.5) // angle 0 


float ml = getPixel (data, width, height, col, rowtl) ; 
float m2 = getPixel (data, width, height, col, row-1) ; 
if (mO < ml || mO < m2) 

magnitudes[index] - 0; 


5. Uist) EZ ie SE 


非 最 大 信号 压制 以 后 边缘 会 被 细 化 ， 但 是 仍然 有 一 些 虽 然 有 幅 值 但 不 是 边缘 的 像素 被 保留 ， 基 于 一 个 阔 值 实现 二 值 化 的 方法 往往 导致 边缘 像素 丢失 或 非 边 缘 像 素 被 保留 ，Canny 通 过 设置 两 个 靖 值 (一 
个 高 国 值 TH， 一 个 低 阔 值 TL) 来 实现 边缘 像素 的 连接 ， 通 常 两 个 靖 值 之 比 为 3: 1 (TH: TL) 。 根 据 双 阅 值 实现 边缘 连接 时 遵守 如 下 规则 : 


* 任意 小 于 TL 的 边缘 像素 被 丢弃 。 


* 任意 大 于 TH 的 边缘 像素 被 保留 。 


* 任意 边缘 像素 P 为 TL<P<TH， 如 果 能 通过 边缘 连接 到 一 个 边缘 大 于 TH 而 且 经 过 的 边缘 点 都 大 于 最 小 阅 值 TL 的 则 保留 ， 否 则 丢弃 。 


双 阅 值 边缘 连接 的 实现 代码 如 下 : 


// 通常 比值 为 TL: TH = 1 : 3, 根据 两 个 阀 值 完成 二 值 化 边缘 连接 

// 边缘 连接 一 Link edges 

Arrays.fill (data, 0) ; 

int offset = 0; 

for (int row = 0; row < height; rowt+) { 

for (int col = 0; col < width; col++) { 

if (magnitudes[offset] »- highThreshold && data[offset] -- 0) 
{ 


follow (col, row, offset, lowThreshold) ; 


offsett++; 


主要 通过 递归 实现 边缘 连接 ， 其 中 follow () 方法 实现 代码 如 下 所 示 : 


private void follow (int xl, int yl, int index, float threshold) { 
int x0 = (x1--0) ? xl Ss 
int x2 = (xl == width - 1) ? xl: xl + 1; 
int yO = yl =0? yl: yl- 1; 
int y2 = yl == height -1 ? yl: yl + 1; 
data [index] = magnitudes [index]; 


for (int x = x0; x <= x2; xt) { 
for (int y = y0; y <= y2; y++) { 

int i2 = x + y * width; 
if ((y!=yl || x! = x1) 

&& data[i2] == 0 

&& magnitudes[i2] >= threshold) { 
follow (x, y, i2, threshold) ; 
return; 


双 阔 值 处 理 与 边缘 连接 以 后 ， 非 边缘 像素 被 丢弃 ，Canny 边 缘 提 取 算 法 基本 完成 ， 但 是 为 了 显示 图 像 边 缘 提取 的 结果 ， 往 往 会 加 上 一 步 二 值 化 来 显示 Canny 边 缘 检 测 处 理 之 后 的 结果 . 
6 结果 二 值 化 显示 边缘 
基于 Canny 边 缘 检 测 的 结果 ， 如 果 值 大 于 0 则 标注 为 白色 ， 否 则 为 黑色 像素 ， 实 现代 码 如 下 所 示 : 


// 二 值 化 显示 
for (int i=0; i<inPixels.length; i++) 


{ 


int gray = clamp ( (int) data[i]) ; 
outPixels[i] = gray > 0? -1 : Oxff000000; 


最 终 CannyEdgeFilter 类 运行 结果 如 图 9-12 所 示 。 


图 9-12 ”Candy 边缘 


其 中 最 小 阅 值 TL = 10， 最 大 阅 值 TH = 30。 完 整 的 Canny 边 缘 检 测算 法 源 代码 请 参见 源 文 件 的 CannyEdgeFilterjava， 读 者 可 以 阅读 与 理解 、 调 用 运行 该 代码 。 


介绍 了 经 典 的 图 像 


本 章 详细 介绍 了 图 像 边缘 提取 的 各 种 常见 方法 ， 理 论 联 系 实际 ， 对 每 种 方法 都 做 了 详尽 的 原理 解释 与 代码 实现 ， 真 正 做 到 了 用 代码 实现 帮助 读者 理解 各 种 边缘 提取 方法 与 手段 。 最 后 介绍 
边缘 检测 算法 一 一 Canny 边 缘 检测 ， 一 步 步 解释 与 实现 ， 帮 助 读者 串联 所 学 知识 ， 融 会 贯通 加 深 理 解 ， 更 好 地 掌握 图 像 边 缘 提 取 各 种 方法 之 间 的 区 别 与 联系 。 同 时 本 章 涉 及 一 些 基 本 数学 知识 的 介绍 ， 读 者 
在 学 习 本 章 知 识 的 同时 ， 了 解 导 数 、 


高 斯 公式 、 拉 普 拉 斯 公式 等 数学 知识 有 助 于 更 好 地 理解 与 掌握 本 章 内 容 。 


| 
/—L. 


第 9 章 学 习 了 图 像 边缘 检测 与 提取 的 各 种 相关 知识 ， 多 数 时 候 边 缘 提 取 都 是 基于 灰 度 图 像 开 始 ， 最 终结 果 以 二 值 图 像 出 现 的。 本 章 将 学 习 二 值 图 像 各 种 分 析 方法 ， 关 于 如 何 将 灰 度 图 像 转换 为 二 值 图 像 在 
第 8 章 中 已 经 有 详细 介绍 ， 本 章 不 再 袭 述 。 二 值 图 像 分 析 应 用 在 计算 视觉 与 对 象 识别 与 分 析 等 领域 是 非常 重要 的 图 像 处 理 技术 ， 本 章 将 从 介绍 二 值 图 像 的 基本 特征 、 半 色调 显示 等 基本 内 容 入 手 ， 由 浅 入 深 系 
统 地 介绍 二 值 图 像 抖 动 、 噪 声 消 除 、 连 通 区 域 寻找 与 组 件 标记 、 边 界 跟 踪 、 骨 架 提 取 、 几 何 特性 等 常见 分 析 处 理 方法 。 这 些 知 识 在 实际 应 用 中 都 是 非常 重要 与 基础 的 。 同 时 本 章 同 样 也 会 涉及 一 些 简单 数学 


知识 的 介绍 与 应 用 。 希 望 读者 在 学 习 本 章 知识 的 同时 也 多 了 解 一 下 相关 数学 知识 ， 这 有 助 于 更 好 地 帮助 自己 学 习 本 章 内容 。 


在 具体 介绍 半 色 调 算法 之 前 ， 首 先 介绍 二 值 图 像 的 概念 。 在 图 像 处 理 中 ， 二 值 图 像 是 指 只 由 两 个 值 组 成 的 图 像 ， 其 中 0 表示 黑色 、1 表 示 白 色 ， 简 单 地 说 ， 图 像 只 能 包含 两 种 颜色 一 一 黑色 与 白色 。 正 是 
因为 二 值 图 像 只 包含 两 种 颜色 ， 处 理 起 来 相对 简单 方便 ， 所 以 二 值 图 像 分 析 在 很 多 领域 应 用 中 有 着 非常 重要 的 地 位 。 常 见 的 二 值 图 像 分 析 任 务 如 下 : 


` 噪声 压制 或 干扰 消除 
. 连通 组 件 标记 与 着 色 


: 轮廓 提取 与 边缘 跟踪 


| 区 域 边 缘 细 化 


C 几何 特征 计算 《区 域 角度 、 质 心 ) 


在 打印 机 功能 匮乏 的 时 代 ， 大 部 分 只 支持 黑白 两 种 颜色 ， 但 是 很 多 时 候 要 在 报纸 上 显示 灰 度 图 像 ， 解 决 这 一 问题 的 算法 称 为 半 色 调 算法 (halfton-algorithm) 。 从 本 质 来 说 ， 半 色调 算法 是 一 种 错误 扩 
散 ， 最 常见 的 基于 错误 扩散 的 半 色 调 算法 步骤 如 下 。 


1) 获取 图 像 像素 数组 input[M xN]. 

2) 循环 每 个 像素 计算 : 

a) 计算 当前 像素 总 的 错误 分 布 值 EP。 

b) 计算 当前 像素 总 的 错误 E=P (m, n) +EP, 


c) 如 果 E 大 于 阔 值 T， 则 设 当 前 像素 为 白色 ， 同 时 Eg = 2xE-T。 如 果 E 小 于 阅 值 T， 则 设 当前 像素 为 黑色 ， 同 时 Eg = E. 


TON 


d) 根据 错误 扩散 和 矩阵， 将 E 分 别 扩散 到 其 他 对 应 像素 。 
3) 得 到 输出 像素 数组 output[M x N]。 


完整 的 半 调 色 错误 扩散 的 代码 如 下 : 


package com.book.chapter.ten; 
import java.awt.image.BufferedImage; 
import com.book.chapter.four.AbstractBufferedImageOp; 
public class HalftoneFilter extends AbstractBufferedlmageOp { 
private Float[][] error dist = new float[][]{{0, 0.2£, 0}, {0.6f, O. 
private float threshold; 
public HalftoneFilter () 
{ 


} 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight on 
1) 
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threshold = 128; 


if (dest == nul 

dest = createCompatibleDestImage (src, null) ; 
// 初 始 化 ， 获 取 输 入 图 像 像素 数组 
int[] inPixels = new int[width * height]; 


int[] outPixels = new int[width * height]; 
getRGB (src, 0, 0, width, height, inPixels) ; 
int drow = error dist.length; 

int dcol error dist[0].length; 

t index = 0; ~ 

oat eg = 0; // 总 的 错误 

loat ep = 0; // 转移 到 下 个 像素 点 的 错误 分 分 散 

for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 

int rl = (inPixels[index] >> 16) & Oxff; 


float tp = rl + ep; 

if (tp > threshold) 

{ 
outPixels [index] = -1; // 和 白色 
eg = tp - 2*threshold; 

else 


{ 


outPixels [index] = Oxff000000; //£& 
eg = threshold; 


} 
// 错误 扩散 功能 
for (int sr-0; sr«drow; sr++) 


{ 


int nrow = sr + row; 
if (nrow >= height) 
{ 


nrow = 0; 
} 
for (int sc=0; sc«dcol; sct++) 


{ 


int ncol = sc + col; 
if (ncol >= width) 


ncol = 0; 


int p = getPixel (inPixels, width, height, ncol, nrow) ; 
p= (int) (p + eg * error dist[sr] [sc]) ; 
setPixel (inPixels, width, height, ncol, nrow, p); 


SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 


private void setPixel (int[] input, int width, int height, int col, int row, int p) 
{ 
if (col < 0 || col >= width) 
col = 0; 
if (row < 0 || row >= height) 
row = 0; 
int index = row * width + col; 
input [index] = (Oxff << 24) | (clamp (p) << 16) | (clamp (p) << 8) | clamp (p) ; 


private int getPixel (int[] input, int width, int height, int col, 
int row) { 
if (col < 0 || col >= width) 
col = 0; 
if (row < 0 || row >= height) 
row = 0; 
index = row * width + col; 
tr = (input[index] >> 16) & Oxff; 


uz 


int 
in 
return tr; 


a: 
a 


运行 与 测试 HalftoneFilter.java 时 ， 只 需要 在 ImagePanel 的 process 方 法 中 添加 如 下 几 行 代码 即 可 : 


HalftoneFilter filter = new HalftoneFilter () ; 
destImage = filter.filter (sourceImage, null) ; 


ImagePaneljava 的 完整 源 代 码 清单 请 参见 源 文件 中 第 3 章 的 代码 。 对 基于 灰 度 图 像 的 半 调 色 算 法 ， 读 者 还 可 以 党 试 其 他 不 同 的 错误 扩散 和 矩阵 ， 通 过 实践 加 深 认识 。 对 于 提 到 的 二 值 图 像 来 说 ， 一 样 可 以 
应 用 半 调 色 算法 ， 这 些 内 容 将 在 下 一 节 内 容 中 详细 讲述 


10.2. 图像 抖 动 算 法 


图 像 抖 动 算法 本 质 上 是 图 像 半 调 色 算 法 的 一 个 分 支 发 展 ， 最 常见 各 种 图 像 抖 动 算法 主要 用 来 显示 二 值 图 像 ， 常 见 的 为 基于 阔 值 的 抖动 方法 ， 就 是 大 家 所 说 的 大 于 127 为 白色 ， 反 之 则 为 黑色 。 这 里 介绍 
两 种 基于 错误 扩散 的 图 像 拌 动 算法 ,分别 为 弗 洛 伊 德 -斯 坦 德 伯 格 拌 动 (Floyd-Steinberg Dither) 算法 、 阿 特 金森 抖动 (Atkinson Dither) 算法 。 该 类 算法 的 大 致 思想 都 是 获取 灰 度 图 像 的 像素 值 ， 根 据 像 
素 值 查找 颜色 匹配 表 ， 找 到 与 之 颜色 相近 的 色彩 之 后 ， 把 该 颜色 值 作为 该 像素 点 的 值 ， 然 后 计算 两 个 值 之 间 的 差 值 作为 总 的 错误 ， 并 根据 错误 扩散 矩阵 与 系数 分 别 把 错误 加 到 指定 像素 点 像素 值 上 ， 对 图 像 
的 每 个 像素 点 都 完成 此 操作 就 实现 了 图 像 的 二 值 抖 动 算 法 。 对 彩色 图 像 进行 处 理 时 ， 与 灰 度 图 像 的 处 理 方法 类 似 ， 感 兴趣 的 读者 可 以 自己 进一步 研究 与 党 试 。 


1. 基 于 错误 扩散 抖动 算法 基本 步骤 

具体 步骤 如 下 : 

1) 获取 输入 的 灰 度 图 像 像 素 值 数组 。 

2) 对 每 个 像素 值 完成 以 下 操作 。 

a) 计算 当前 像素 值 P (x, y) = OP 与 给 定 的 颜色 查找 表 中 哪个 颜色 最 相近 ， 得 到 该 颜色 值 C。 
b) 把 C 当 做 该 像素 点 P (x，y) 的 像素 值 ， 同 时 计算 E = OP-C 做 该 像素 点 的 总 错误 。 

C) 根据 错误 扩散 公式 ， 分 别 乘 上 对 应 系数 ， 将 错误 值 分 配 到 各 个 像 个 源 像素 点 。 

3) 循环 对 每 个 像素 完成 第 二 步 的 操作 即 完成 该 算法 。 


其 中 弗 洛 伊 德 .斯 坦 德 伯 格 持 动 的 错误 扩散 公式 如 下 : 


0.15/5 0.3125 


阿 特 金森 抖动 的 错误 扩散 公式 如 下 : 


U 0.125 0.125 
0.125 | 0.125 0.125 Ü 
0 0.125 0 Ü 


这 里 的 * 表 示 当 前 像素 位 置 ， 弗 洛 伊 德 .斯 坦 德 伯 格 拌 动 在 1976 年 由 Robert W.Floyd 和 Louis Steinberg 两 个 人 共同 开发 ， 而 阿 特 金 森 拌 动 算法 是 苹果 公司 的 一 个 程序 员 开 发 出 来 的 ， 此 人 的 英文 名 字 就 叫 


Atkinson。 
2. 代 码 实 现 


根据 上 面 抖 动 算法 的 基本 流程 可 知 ， 实 现 弗 洛 伊 德 .斯 坦 德 伯 格 抖动 与 阿 特 金森 抖动 算法 最 主要 的 是 根据 它们 各 自 的 扩散 和 矩阵 分 配 错误 值 到 相关 的 像素 点 中 。 其 中 弗 洛 伊 德 .斯 坦 德 伯 格 抖动 的 扩散 和 矩 阵 中 
有 四 个 非 零 值 ， 所 以 需要 将 错误 值 扩 散 分 配 到 这 四 个 相 邻 像素 中 ， 而 阿 特 金森 抖动 的 扩散 和 矩 阵 中 有 六 个 非 零 值 ， 同 样 需要 将 得 到 的 当前 像素 错误 值 分 配 到 这 六 个 相关 像素 点 中 。 完 整 的 抖动 二 值 图 像 源 代码 
如 下 : 


package com.book.chapter.ten; 

import java.awt.image.BufferedImage; 

import com.book.chapter.four.AbstractBufferedImageOp; 

public class BinaryDitherFilter extends AbstractBufferedImageOp { 
public final static int[][] COLOR PALETTE = new int[][] {{0, 0, 0}, {255, 255, 255); 
public final static int FLOYD STEINBERG DITHER - 1; 

public final static int ATKINSON DITHER - 2; 
p 
p 
{ 


rivate int method; 
ublic BinaryDitherFilter () 


method = FLOYD STEINBERG DITHER; 


public int getMethod () { 
return method; 


public void setMethod (int method) 


{ 


this.method = method; 
} 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 
dest = createCompatibleDestImage (src, null) ; 
// 初 始 化 ， 获 取 输 入 图 像 像素 数组 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 
getRGB (src, 0, 0, width, height, inPixels) ; 
int index - 0; 
for (int row = 0; row < height; rowt-) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
index = row * width + col; 
int rl = (inPixels[index] >> 16) & Oxff; 
int gl = (inPixels[index] >> » & Oxff; 
int bl = inPixels[index] & Oxff 
int cIndex - getCloseColor CON gl, bl) ; 
outPixels[index] = (255 << 24) | (COLOR PALETTE[cIndex][0] << 16) | 
(COLOR PALETTE [cIndex] [1] << 8) | COLOR PALETTE [cIndex] [2]; 
// 获取 错误 
int[] ergb = new int[3]; 
ergb[0] = rl - COLOR PALETTE [cIndex] [0]; 
ergb[1] = gl - COLOR PALETTE [cIndex][1]; 
ergb[2] = bl - COLOR PALETTE [cIndex] [2]; 
// 错误 扩散 功能 
if (method == = FLOYD STEINBERG DITHER) 
{ 
float el-7f/16f; 
Float e2-5f/16f; 
Float e3-3f/16f; 
float e4-1f/16f; 
int[] rgbl = getPixel (inPixels, width, height, col-1, row, el, ergb) ; 
int[] rgb2 = getPixel (inPixels, width, height, col, rowtl, e2, ergb) ; 
int[] rgb3 = getPixel (inPixels, width, height, col-1, rowtl, e3, ergb) ; 
int[] rgb4 = getPixel (inPixels, width, height, col+1， rowtl, e4, ergb) ; 
setPixel (inPixels, width, height, col+l, row, rgbl) ; 
setPixel (inPixels, width, height, col, rowtl, rgb2) ; 
setPixel (inPixels, width, height, col-1, rowtl, rgb3) ; 
setPixel (inPixels, width, height, col41, rowtl, rgb4) ; 
} 
else if (method == ATKINSON DITHER) 
{ 
Float e1=0.125f; 
int[] rgbl = getPixel (inPixels, width, height, col-1, row, el, ergb) ; 
int[] rgb2 = getPixel (inPixels, width, height, col+2, row, el, ergb) ; 
int[] rgb3 = getPixel (inPixels, width, height, col-1, rowtl, el, ergb) ; 
int[] rgb4 = getPixel (inPixels, width, height, col, row*l, el, ergb) ; 
int[] rgb5 = getPixel (inPixels, width, height, col-1, rowtl, el, ergb) ; 
int[] rgb6 = getPixel (inPixels, width, height, col, row*2, el, ergb) ; 
setPixel (inPixels, width, height, col+1, row, rgbl) ; 
setPixel (inPixels, width, height, col+2, row, rgb2) ; 
setPixel (inPixels, width, height, col-1, rowtl, rgb3) ; 
setPixel (inPixels, width, height, col, rowtl, rgb4) ; 
setPixel (inPixels, width, height, col+l, rowtl, rgb5) ; 
setPixel (inPixels, width, height, col, rowt2, rgb6) ; 
} 
else 
{ 
throw new java.lang.IllegalArgumentException ("Not Supported Dither Mothed! ! ") ; 
} 
} 
} 
SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 
} 
private int getCloseColor (int tr, int tg, int tb) 
int minDistanceSquared = 255*255 + 255*255 + 255*255 + 1; 
int bestIndex = 0; 
for (int i=0; i<COLOR PALETTE . length; i++) { 
int rdiff = tr - COLOR PALETTE[i] : 
int gdiff = tg - COLOR PALETTE [i] [1]; 
int bdiff = tb - COLOR PALETTE[i][2]; 
int distanceSquared = rdiff*rdiff + gdiff*gdiff + bdiff*bdiff; 
if (distanceSquared « minDistanceSquared) { 
minDistanceSquared - distanceSquared; 
bestIndex = i; 
} 
} 
return bestIndex; 
} 
private void setPixel (int[] input, int width, int height, int col, int row, int[] p) 
{ 
if (col < 0 || col >= width) 
col = 0; 
if (row < 0 || row >= height) 
row = 0; 
int index = row * width + col; 
input [index] = (Oxff << 24) | (clamp (p[0]) << 16) | (clamp (p[1]) << 8) | clamp (p[2]) ; 
} 
private int[] getPixel (int[] input, int width, int height, int col, 
int row, float error, int[] ergb) { 
if (col < 0 || col >= width) 
col = 0; 
if (row < 0 || row >= height) 
row = 0; 
int index = row * width + col; 
int tr = (input[index] >> 16) & Oxff; 
int tg = (input[index] >> 8) & Oxff; 
int tb = input[index] & Oxf 
tr = (int) (tr + error * ergb[0]) ; 
tg = (int) (tg + error * ergb[1]) ; 
tb = (int) (tb + error * ergb[2]) ; 
return new int[]{tr, tg, tb}; 
} 
} 
运行 与 测试 这 两 个 抖动 算法 时 ， 只 需要 在 ImagePanel 类 的 process 方 法 中 如 下 几 行 代码 即 可 : 
BinaryDitherFilter filter = new BinaryDitherFilter () ; 
filter.setMethod (BinaryDitherFilter.ATKINSON DITHER) ; 
destImage = filter.filter (sourceImage, null) ; 
完整 的 ImagePaneljava 源 代码 请 参见 源 文 件 中 第 3 章 的 代码 。 基 于 错误 扩散 的 抖动 算法 不 止 本 节 介 绍 的 这 两 种 ， 感 兴 
hier ui 
10.3 ”二 值 图 像 泛 洪 十 元 算法 
二 值 图 像 几 何 形状 颜色 填充 标识 是 在 二 值 图 像 处 理 中 经 常 需要 用 的 ， 其 中 最 常用 的 算法 是 泛 洪 填充 算法 ， 该 算法 有 两 种 实现 方法 ， 


< 趣 的 读者 可 以 自己 进 一 


一 种 基于 递 


步 学 习 相 关 知 识 。 


ag 


归 实 现 ， 另 外 一 种 基于 扫描 线 实现 。 其 基本 


FA *E 


TINTS: 


闭 区 域内 任意 一 个 像素 点 开始 ， 填 充 周围 四 邻 域 像素 点 或 八 邻 域 像素 点 ， 不 断 迭 代 直到 封闭 区 域内 的 所 有 像素 都 被 指定 的 颜色 填充 为 止 。 另 外 一 种 是 以 某 一 点 为 基点 ， 在 垂直 方向 开始 扫描 ， 然 


就 是 从 封 
后 对 水 平方 


向 进行 扫描 ， 直 到 封闭 区 域内 的 所 有 点 被 填充 为 止 。 


1. 基 于 邻 域 像素 寻找 的 实现 


基于 四 邻 域 像素 寻找 时 ， 假 设 对 开始 像素 点 P_ (x, y) 填充 了 指定 的 颜色 ， 现 在 要 寻找 该 像素 点 上 下 左右 四 个 像素 点 ， 如 果 没 有 填充 ， 则 填充 它们 ， 并 且 继续 寻找 它们 的 四 邻 域 像素 ， 直 到 封闭 区 域内 的 
所 有 像素 点 都 被 指定 颜色 填充 为 止 。 像 素 点 P 及 其 四 邻 域 像素 如 图 10-1 所 示 。 


图 10-1 ”四邻 域 像素 示意 图 


基于 四 邻 域 填 充 方法 的 递归 实现 代码 如 下 : 


public void floodFill4 (int x, int y, int newColor, int oldColor) 
{ 


if (x >= 0 && x < width && y >= 0 && y < height 


&& getColor (x, y) == oldColor && getColor (x, y) ! = newColor) 
{ 
setColor (x, y, newColor) ; //set color before starting recursion 
loodFill4 (x + 1, y, newColor, oldColor) ; 
floodFill4 (x - 1, y, newColor, oldColor) ; 
floodFill4 (x, y + 1, newColor, oldColor) ; 
floodFill4 (x, y- 1, newColor, oldColor) ; 


八 邻 域 泛 洪 填充 算法 与 四 邻 域 泛 洪 填充 类 似 ， 唯 一 不 同 的 是 它 会 寻找 像素 点 P (x，y) 周围 的 八 个 像素 点 继续 填充 ， 直 到 封闭 区 域 被 指定 颜色 完成 填充 为 止 。 像 素 P 的 八 邻 域 像素 图 如 图 10-2 所 示 。 


EJ10-2. AJ 3E E 


递归 实现 八 邻 域 寻找 泛 洪 填充 方法 的 代码 如 下 : 


public void floodFill8 (int x, int y, int newColor, int oldColor) 


{ 


if (x >= 0 && x < width && y >= 0 && y < height && 


getColor (x, y) == oldColor && getColor (x, y) ! = newColor) 
{ 
setColor (x, y, newColor) ; //set color before starting recursion 
floodFill8 (x + 1, y, newColor, oldColor) ; 
floodFill8 (x - 1, y, newColor, oldColor) ; 
floodFill8 (x, y + 1, newColor, oldColor) ; 
floodFill8 (x, y - 1, newColor, oldColor) ; 
floodFill8 (x + 1, y+ 1, newColor, oldColor) ; 
floodFill8 (x - 1, y - 1, newColor, oldColor) ; 
floodFill8 (x - 1, y + 1, newColor, oldColor) ; 
floodFill8 (x + 1, y - 1, newColor, oldColor) ; 
} 
} 
2. 基 于 扫描 线 实现 


基于 扫描 线 的 泛 洪 填充 算法 实现 有 两 种 方式 ， 一 种 是 基于 递归 方式 ， 另 外 一 种 是 基于 栈 的 非 递归 方式 ， 两 种 实现 方式 虽 不 同 ， 但 是 其 基本 思想 是 一 样 的 ， 都 是 对 指定 的 像素 点 P_(x，y) 首先 沿 着 Y 方 向 
分 别 在 上 下 扫描 填充 颜色 ， 然 后 沿 X 方 向 分 别 左右 移动 一 个 像素 ， 继 续 沿 Y 方 向 的 扫描 。 基 于 递归 实现 扫描 线 算法 的 代码 如 下 : 


public void floodFillScanLine (int x, int y, int newColor, int oldColor) 


{ 


if (oldColor == newColor) return; 
if (getColor (x, y) ! = oldColor) return; 
int yl; 
//draw current scanline from start position to the top 
yl = y; 
while (yl < height && getColor (x, yl) == oldColor) 
{ 
setColor (x, yl, newColor) ; 
yl++; 
} 
//draw current scanline from start position to the bottom 
yl y 
while (yl >= 0 && getColor (x, yl) == oldColor) 
{ 
setColor (x, yl, newColor) ; 
yl==; 
//test for new scanlines to the left 
yl = y; 
while (yl < height && getColor (x, yl) == newColor) 
{ 
if (x > 0 && getColor (x - 1, yl) == oldColor) 
{ 
floodFillScanLine (x - 1, yl, newColor, oldColor) ; 
} 
yl++; 
} 
yl = 1; 


Yu 4; 
while (yl >= 0 && getColor (x, yl) == newColor) 
{ 


if (x > 0 && getColor (x - 1, yl) == oldColor) 
{ 
floodFillScanLine (x - 1, yl, newColor, oldColor) ; 
} 
yl--; 
} 
//test for new scanlines to the right 
yL = y; 
while (yl < height && getColor (x, yl) == newColor) 
{ 
if (x < width - 1 && getColor (x + 1, yl) == oldColor) 
{ 
floodFillScanLine (x + 1, yl, newColor, oldColor) ; 
} 
yl++; 
} 
yL = y= 15 
while (yl >= 0 && getColor (x, yl) == newColor) 
{ 
if (x < width - 1 && getColor (x + 1, yl) == oldColor) 
{ 
floodFillScanLine (x + 1, yl, newColor, oldColor) ; 
} 
yl--3 


对 于 上 述 的 递归 程序 ， 可 以 改写 为 非 递归 基于 栈 的 扫描 线 泛 洪 填 ， 改 写 以 后 的 代码 如 下 : 


public void floodFillScanLineWithStack (int x, int y, int newColor, int oldColor) 
{ 


if (oldColor == newColor) { 
System.out.println ("do nothing ! ! ! , filled area! ! ") ; 
return; 


emptyStack () ; 

int yl; 

boolean spanLeft, spanRight; 
push (x, y); 

while (true) 


{ 


if (x == -1) return; 


while (yl >= 0 && getColor (x, yl) == oldColor) yl--; // go to line top/bottom 
yl++; // start from line starting point pixel 
spanLeft = spanRight = false; 
while (yl < height && getColor (x, yl) == oldColor) 


setColor (x, yl, newColor) ; 
if (! spanLeft && x > 0 && getColor (x - 1, yl) == oldColor) // just keep left line once in the stack 


push (x - 1, yl) ; 
spanLeft = true; 


} 
else if (spanLeft && x > 0 && getColor (x - 1, yl) ! = oldColor) 
{ 


} 
if (! spanRight && x < width - 1 && getColor (x + 1, yl) == oldColor) // just keep right line once in the stack 
{ 


spanLeft = false; 


push (x + 1, yl); 
spanRight = true; 


else if (spanRight && x < width - 1 && getColor (x + 1, yl) ! = oldColor) 


spanRight = false; 


其 中 push () . popx () . popy () 为 栈 进出 的 三 个 相关 操作 ， 完 整 的 泛 洪 填充 算法 FloodFillAl-gorithm.java 与 测试 UI 程序 FloodFillUl.java 的 源 代码 参见 源 文件 的 10-3。 


10.4 ”连通 组 件 标记 算法 


连通 组 件 标记 算法 是 图 像 分 析 最 常用 的 算法 之 一 ， 通 常 被 用 来 寻找 与 标记 连通 的 区 域 。 连 通 组 件 标记 本 质 上 是 给 图 像 中 每 个 像素 指定 一 个 标记 值 ， 同 一 个 连通 区 域 所 有 像素 的 标记 值 保持 一 致 ， 直 到 图 
像 中 所 有 的 像素 都 被 标记 为 止 ， 通 过 合并 标记 使 每 个 连通 区 域 最 终 只 拥有 唯一 标识 。 图 10-3 左 边 为 二 值 图 像 四 个 连通 区 域 ， 右 边 为 组 件 标 记 以 后 的 结果 。 
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图 10-3 ”连通 区 域 与 标记 


从 图 10-3 中 还 可 以 看 出 ， 不 同 的 连通 区 域 里 的 像素 被 标记 为 不 同 的 值 ， 相 同 的 区 域 有 相同 的 标记 值 。 连 通 组 件 标记 需要 遍历 连通 区 域 的 每 个 像素 。 图 的 遍历 实现 分 为 广度 优先 与 深度 优先 ， 本 节 将 利用 
图 的 遍历 算法 实现 二 值 图 像 的 连通 组 件 标记 算法 。 


1. 图 的 广度 优先 搜索 与 深度 优先 搜索 


图 的 广度 优先 搜索 算法 是 从 一 个 节点 开始 ， 访 问 所 有 相 令 节点， 然后 从 这 些 相 邻 节点 再 出 发 ， 访 问 所 有 相 邻 的 子 节点 ， 如 此 达 代 直到 图 中 所 有 的 节点 都 被 访问 为 止 。 下 面 是 一 个 广度 优先 遍历 无 向 图 所 
有 节点 的 例子 (如 图 10-4 所 示 ) . 
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同时 标记 2、3、 adie paa IH bRIUS. 6 KRAS ACAD 


图 10-4 ”节点 人 遍历 过 程 


图 的 深度 优先 搜索 则 是 从 一 个 点 出 发 寻找 与 该 点 相连 的 节点 ， 标 记 之 后 ， 继 续 从 相连 节点 出 发 直到 找 不 到 任何 相连 的 而 且 未 标记 的 节点 为 止 。 假 设 无 向 图 如 图 10-5 所 示 。 


加 | 


图 10-5 ”节点 示意 图 


从 节点 1 开始 出 发 ， 通 过 深度 优先 搜索 ， 先 到 节点 4， 然 后 到 节点 2， 再 到 节点 959， 最 后 到 节点 3， 到 节点 3 后 再 也 找 不 到 任何 相连 而 且 未 标记 的 节点 了 ， 则 节点 3 状态 设置 为 已 经 访问 ， 然 后 返回 节点 5， 同 
样 将 其 设置 为 已 经 访问 ， 以 此 类 推 直到 节点 1 设置 为 已 经 访问 。 从 上 述 流程 中 不 难看 出 ， 广 度 优先 搜索 算法 是 基于 队列 的 先进 先 出 ， 而 深度 优先 搜索 则 是 基于 栈 结构 的 先进 后 出 。 基 于 Java 语 言 实现 简单 的 栈 
与 队列 代码 可 以 参见 源 文件 中 10-4 里 的 MyStack.java 与 MyQueue.java， 这 里 不 下 袭 述 。 如 果 把 图 像 中 的 每 个 像素 看 作 图 的 每 个 节点 ， 则 可 以 运用 图 的 广度 或 深度 优先 搜索 实现 连通 组 件 的 寻找 。 所 以 对 每 
个 像素 可 以 设置 初始 节点 状态 与 标记 值 ， 将 像素 点 表示 为 图 节点 的 Java 语 言 代 码 描述 同样 可 参见 源 文 件 中 10-4 里 的 PixelPointjava。 获 取 二 值 图 像 所 有 像素 初始 化 以 后 ， 得 到 像素 节点 数组 ， 基 于 队列 实现 


广度 优先 搜索 算法 的 代码 如 下 : 


public void process () 

{ 

if (this. pixelLi st == null) return; 
int label = 1; 

for (PixelPoint pp : pixelList) 

{ 


f (pp.getValue () >= grayLevel) 


=~ H- 


f (pp.getStatus () == PixelPoint.UNMARKED) 


=~ H- 


pp.setStatus (PixelPoint.VISITED) ; 
pp.setLabel (label) ; 
MyQueue mq = new MyQueue (10000) ; 

for (PixelPoint npp : pp.getNeighbours () ) 
{ 


if (npp.getStatus () == PixelPoint.UNMARKED && npp.getValue () >= grayLevel) 
{ 


npp.setStatus (PixelPoint.MARKED) ; 
mq.enqueue (npp) ; 
} 


} 
while (! mq.isEmpty () ) 
{ 

PixelPoint obj = (PixelPoint) mq.dequeue () ; 
if (obj.getStatus () == PixelPoint.MARKED) 
{ 


obj.setLabel (label) ; 
obj.setStatus (PixelPoint.VISITED) ; 


} 
for (PixelPoint nnpp : obj.getNeighbours () ) 
{ 


if (nnpp.getStatus () == PixelPoint.UNMARKED && nnpp.getValue () >= grayLevel) 
{ 


nnpp.setStatus (PixelPoint.MARKED) ; 
mq.enqueue (nnpp) ; 


} 


} 


} 
label++; 


基于 栈 实 现 深度 优先 搜索 的 代码 如 下 : 


见 深度 
Joi. 


public void process () 


{ 


if (this.pixelLhist == null) return; 
int label = 1; 
for (PixelPoint pp : pixelList) 


{ 


f (pp.getValue () >= grayLevel) 


=~ H- 


PixelPoint. 


f (pp.getStatus () 


=~ H- 


// initialization stack 
pp.setStatus (Pixel 
pp.setLabel (label) ; 
MyStack ms = new MyStack (4) $ 
MyStack markedPoint - 
ms.push (pp) ; 

// Depth First Search 
while (! ms.isEmpty () ) 
{ 


PixelPoint obj = 
markedPoint. PUSH 


UNMARKED) 


|Point.MARKED) ; 


new MyStack (4000) ; 


(PixelPoint) ms.pop () ; 


xelPoint.MARKED) 


if (obj.getStatus () == Pi 
{ 


for (PixelPoint nnpp : 


{ 


f (nnpp.getStatus 


=~ H- 


nnpp.setStatus 


obj.getNeighbours () ) 
QO 


PixelPoint.UNMARKED && nnpp.getValue () 


>= grayLevel) 


(PixelPoint.MARKED) ; 


ms.push (nnpp) ; 


} 


} 

// tag label now! ! 

while (! markedPoint.isEmpty () 
{ 
PixelPoint obj = 
obj.setLabel (label) ; 


obj.setStatus (PixelPoint.VISIT 


) 


(PixelPoint) markedPoint.pop () ; 


ED) ; 


} 
label++; 


像素 节点 的 状态 有 三 种 ， 分 别 为 UNMARKED， 表 示 节 


r3 


实现 参 
2. 基 于 广度 或 深度 优先 搜索 实现 连通 组 件 标记 


基于 图 的 广度 或 深度 优先 搜索 算法 实现 


连通 组 件 标记 算 


见 源 文件 中 10-4 里 的 BFSAlgorithm.java eg 


法 的 代码 如 下 。 


1) 实现 像素 节点 初始 化 及 上 下 左右 这 四 个 相连 像素 节点 的 添加 ， 代 码 如 下 : 


// 初始 化 每 个 像素 节点 状态 

for (int row=0; row<height; rowt+) { 

for (int col=0; col«width; col++) { 
index = row * width + col; 
PixelPoint p - new PixelPoint (row, 
pixelList.add (p) ; 


) 


} 

// 添加 每 个 像素 节点 的 四 邻 域 像素 

for (int row-0; row«height; rowt+) { 

for (int col=0; col«width; col++) { 
index = row * width + col; 


col, 


(inPixels[index] >> 16) & Oxff) ; 


PixelPoint p = pixelList.get (index) ; 


(index) ) ; 


// add four neighbors for each pixel 
if ( (row - 1) >= 0) 
{ 
index = (row-1) * width + col; 
p.addNeighour (pixelList.get 
if ( (row + 1) < height) 
{ 
index = (row+1) * width + col; 


p.addNeighour (pixelList.get 


f ( (col - 1) 


>= 0) 


ma H- =~ 


index = row * width + col-1; 
p.addNeighour (pixelList.get 


f ( (col+1) 


< width) 


ma H- ~- 一 


index = row * width + col+1; 
p.addNeighour (pixelList.get 


对 所 有 像素 节点 完成 初始 化 以 后 就 可 以 进行 


2) 通过 广度 或 深度 优先 搜索 实现 


// 深度 优先 搜索 算法 ， 连 通 组 件 标 记 
DFSAlgorithm dfs = new DFSAlgorithm (pixel 
dfs.process () ; 

System.out.println ("Total Number of 


Labels : 


广度 优先 搜索 实现 代码 如 下 : 


BFSAlgorithm bf 
bfs.process () ; 
System.out.println ("Total Number of Labels : 


BFSAlgorithm (pixel 


S — new 


3) 连通 组 件 随 机 着 色 与 显示 ， 完 成 第 二 步 以 后 
码 如 下 : 


连通 组 件 标记 ， 以 第 一 步 的 结果 为 输入 参数 ， 实 现 连 


得 到 的 连 


(index) ) ; 


(index) ) ; 


(index) ) ; 


下 一 步 处 理 了 。 


List) ; 


"T + at 


s.getTotalOfLabels () ) ; 


ist) 3 


" + bfs.getTotalOfLabels () ) ; 


通 组 件 被 标记 为 不 同 的 值 ， 对 这 些 不 同 的 连 


是 未 完成 访问 ; VISITED ， 表 示 节 点 已 经 被 访问 过 。 


车 通 组 件 标记 与 查找 ， 深 度 优先 搜索 实现 代码 如 下 : 


车 通 区 域 需要 显示 不 同 颜色 ， 这 里 通过 随机 生成 每 个 连 


cg 


JOE 


车 通 区 域 的 颜色 


r2 


实现 连 


整 的 广度 优先 搜索 与 深度 优先 搜索 算法 的 代码 


车 通 组 件 着 色 与 显示 ， 实 现代 


// post Process 一 区 域 连通 组 件 着 色 


for 


row«height; row++) ( 

int ta- 0, tr 2-0, tg=0, to = 0; 

for (int col=0; col«width; col++) { 
index = row * width + col; 
PixelPoint p = pixelList.get (index) ; 
ta = 255; 

if (p.getLabel () 

{ 


(int row=0; 


> 0) 


Color c = getColor (p.getLabel () ) ; 
tr = c.getRed () ; 


tg = c.getGreen () ; 
tb = c.getBlue () ; 
} 
else 
{ 
tr = p.getValue () ; 
tg = p.getValue () ; 
tb = p.getValue () ; 


outPixels[index] = (ta << 24) | (tr << 16) | (tg «« 8) | tb; 


根据 标记 值 的 不 同 ， 生 成 标记 颜色 方法 的 代码 如 下 : 


private Color getColor (I 


{ 


iy 


om 
完整 


10.5 


二 值 图 像 作 为 一 种 特殊 的 图 像 形 态 ， 其 边缘 提取 相对 简单 ， 如 果 有 噪声 ， 首 先 可 以 基于 组 件 标记 算 
二 值 图 像 的 边缘 提取 可 以 采用 拉 普 拉 斯 算 子 一 次 完成 ， 关 于 拉 普 拉 斯 边缘 提取 的 知识 可 以 参见 第 9 章 的 相关 内 容 ，i 


缘 提 取 ， 


nteger label) 


Color c = colorMap.get (label) ; 


if (c — null) 
int red = (int) (Math.random () * 255) ; 
int green = (int) (Math.random () * 255) ; 
int blue = (int) (Math.random () * 255) ; 


c = new Color (red, green, blue) ; 
colorMap.put (label, c) ; 
} 


return Cc; 


通 组 件 标 记 算 法 的 代码 参见 源 文件 中 10-4 里 的 LabelledConnectedRegionAlg.java。 实 现 图 像 连 


二 值 图 像 边 绿 跟 路 


通 组 件 标 记 的 算法 还 可 以 基于 递归 扫描 先 标记 后 检查 合并 标记 的 方法 ， 感 兴趣 的 读者 可 以 自己 实 


法 去 掉 像 素 总 数 小 于 辣 值 T 的 噪声 区 域 ， 或 者 通过 高 斯 模糊 来 降低 噪声 影响 ， 然 后 就 可 以 对 图 像 进 行 边 


这 里 不 再 袭 述 。 有 图 像 边 缘 以 后 ， 通 过 对 边缘 跟踪 处 理 实现 图 像 对 象 轮廓 提取 ， 为 


步 识别 匹配 做 准备 。 实 现 对 简单 对 象 图 像 轮廓 提取 的 边缘 跟踪 算法 常见 的 有 两 种 ， 分 别 是 Square Tracing 与 Moore-Neighbour 算 法 ， 下 面 就 分 别 详细 介 


1.Square Tracing 算 法 


Square Tracing 边 缘 跟 踪 的 主要 思想 是 


每 次 扫描 到 一 个 黑色 像素 时 ， 继 续 向 左 扫描 ; 


一 束 
JOLIE. 


1) 


每 次 扫描 到 白色 背景 像素 时 ， 继 续 向 右 扫描 直到 再 次 
整 实现 基于 边缘 跟踪 的 轮廓 提取 程序 如 下 。 


初始 化 ， 获 取 二 值 图 像 像素 数组 ， 其 实现 代码 如 下 : 


// 初 始 化 ， 获 取 输 入 图 像 像素 数组 


t[] inPixels = new int[width * height]; 


t[] outPixels = new int 
getRGB (src, 0, 0， 


[width * height]; 
width, height, inPixels) ; 


2) 自 下 而 上 ， 由 左 到 右 扫描 像素 数组 ， 找 到 起 始 像素 点 StartPixel， 代 码 如 下 : 
MyQueue mq = new MyQueue (100000) ; 
PixelPoint startP - null; 
boolean foundStartP - false; 
// KABA 
for (int col = 0; col < width; col++) { 
/7 ERAL 
for (int row = height-1; row >= 0; row--) { 
// 获取 像素 值 
int gl = getPixel (inPixels, width, height, col, row) ; 
if (gl == 0 && startP == null) 
{ 
startP = new PixelPoint (row, col, gl) ; 
mq.enqueue (startP) ; 


3) 从 起 始 像素 点 开始 ， 向 左 或 向 右 扫 描 ， 得 到 边缘 像素 则 添加 到 边缘 队列 中 ， 直 到 又 重新 回 到 开始 像素 StartPixel， 


PixelPoint currentP - null; 


foundStartP - true; 
break; 


} 


f (foundStartP) 


a H- ~ 一 


break; 


{ 


while (! samePixel (currentP, startP) ) 

if (currentP = null) 

{ 
// 初始 化 开始 像素 
int xp = startP.getX () ; 
int yp = startP.getY () ; 
// System.out.println ("xp : " + xp + "yp: "+ yp) ; 
int lxp = xp = 1; 
int gr = getPixel (inPixels, width, height, lxp, yp); 
currentP = new PixelPoint (yp, lxp, gr); 
currentP.setLabel (LEFT X) ; 


else 


假设 图 像 背 景 为 白色 ， 前 景 像素 为 黑色 ， 从 底 向 上 ， 从 左 到 右 地 扫描 每 个 像素 ， 扫 描 到 第 一 个 黑色 像素 标记 为 边缘 开始 像素 点 ， 然 后 执行 如 下 操作 : 


遇 到 被 标记 的 起 始 黑 色 像素 ， 结 束 扫描 。 


代码 如 下 : 


int direction = currentP.getLabel () ; 
int xp = currentP.getX () ; 
int yp = currentP.getY () ; 
// System.out.println ("xp : "+ xp + "yp: " + yp) ; 
// 发 现 边缘 像素 
if (currentP.getValue () == 0) 
{ // turn left 

mq.enqueue (currentP) ; 
if (direction -- LEFT X) 
{ 


yp = yp + 1; 
direction = DOWN Y; 
} 
else if (direction == RIGHT X) 
{ 


ye = yp = 1; 
direction = UPPER Y; 
} 
else if (direction == UPPER Y) 
{ 


p= xp - 1; 
direction = LEFT X; 
} 
else 
{ 
xp = xp + 1; 


direction = RIGHT X; 
} 
} 
else 
{ // 非 边缘 像素 ， 继 续 寻 找 
f (direction == LEFT X) 


es 


yp = yp - 1; 
direction = UPPER Y; 


} 
else if (direction == RIGHT X) 
{ 


yp = yp + 1; 
direction = DOWN Y; 
} 
else if (direction == UPPER Y) 
{ 


xp = xp +1; 
direction = RIGHT X; 
} 
else 
{ 
xp = xp - 1; 


direction = LEFT X; 


} 


} 

// 设 定 当 前 像素 值 

int gr = getPixel (inPixels, width, height, xp, yp); 
currentP = new PixelPoint (yp, xp, gr) ; 
currentP.setLabel (direction) ; 


4) 初始 化 背景 像素 为 白色 ， 显 示 边 缘 像 素 队 列 中 每 个 像素 ， 得 到 输出 结 


// 白色 背景 

Arrays.fill (outPixels, -1) ; 
while (1 mq.isEmpty O 

{ 


PixelPoint edgePixel = (PixelPoint) mq.dequeue () ; 
int col = edgePixel.getX () ; 

int row = edgePixel.getY () ; 

setPixel (outPixels, width, height, col, row, 0); 


完整 的 Square Tracing 算 法 源 代 码 SquareTraceAlgorithm.java 参 见 本 书 源 文 件 中 的 10-5。 其 运行 结果 如 图 10-6 所 示 (左边 为 原 边 为 对 象 轮廓 ) 。 


值得 注意 的 是 ，Square Tracing 算 法 本 质 上 是 一 种 基于 四 邻 域 链接 寻找 边缘 跟踪 的 算 
开始 像素 的 方向 完全 一 致 才 停止 继续 边缘 寻找 。 感 兴趣 的 读者 可 以 自己 进一步 尝试。 


2.Moore-Neighbor 跟 踪 算 法 


图 10-6” 轮 廊 提 取 


法 ， 而 且 其 停止 条 件 过 于 简单 ， 


一 个 提高 方法 就 是 改变 停止 条 件 ， 即 假设 


iw 
经 过 


— 


开始 像素 两 次 才 停止 ， 或 者 两 次 进入 


该 算法 基于 Jacob 停 止 条 件 实现 边缘 轮廓 提取 ， 是 一 种 非常 理想 的 对 象 轮廓 提取 算法 ， 在 具体 介绍 该 算法 之 前 ， 首 先 要 明确 什么 才 是 一 个 像素 的 Moore-Neighbor 像 素 ， 一 个 像素 的 周围 八 个 邻 域 像 素 


分 别 被 命名 为 P1~ P8， 如 图 10-7 所 示 。 


10-7 ARBA 


其 中 P 为 当前 像素 。Moore-Neighbor 跟 踪 算法 的 思想 是 假设 二 值 图像 为 白色 背景 ， 连 通 组 件 为 黑色 像素 ， 现 在 自 底 向 上 、 从 左 到 右 扫描 每 一 列 的 每 个 像素 ， 当 扫描 到 黑色 像素 P 时 ， 进 行 标 记 ， 然 后 回 
退 到 上 一 个 扫描 像素 位 置 ， 沿 着 顺 时 针 方 向 扫描 P 周 围 的 像素 ， 如 果 遇 到 下 一 个 黑色 像素 则 继续 重复 该 动作 ， 直 到 第 二 次 经 过 起 始 扫 描 到 的 黑色 像素 为 止 。 所 有 被 标记 的 黑色 像素 组 成 的 像素 点 即 为 对 象 轮 
廓 。 程 序 实 现 基 于 Moore-Neighbor 边 缘 跟 踪 对 象 轮廓 提取 算法 步骤 如 下 : 


1) 初始 化 二 值 图 像 获取 图 像 像素 数组 ， 代 码 如 下 。 


// 初 始 化 ， 获 取 输 入 图 像 像 素数 组 

int[] inPixels = new int[width * height]; 

int[] outPixels = new int[width * height]; 
getRGB (src, 0, 0, width, height, inPixels) ; 


2) 自 下 而 上 、 从 左 到 右 ， 逐 列 扫描 每 个 像素 ， 在 遇 到 第 一 个 黑色 像素 时 ， 标 记 其 为 起 始 像素 ， 代 码 如 下 : 


// KABA 
for (int col = 0; col < width; col++) { 

// 至 底 向 上 
for (int row = height-1; row >= 0; row--) { 

// 获取 像素 值 
int gl = getPixel (inPixels, width, height, col, row) ; 
if (gl == 0 && startP == null) 
{ 


startP = new PixelPoint (row, col, gl) ; 
mq.enqueue (startP) ; 

foundStartP = true; 

break; 


f (foundStartP) 


a H- ~ 一 


break; 


we 


3) 从 起 始 像素 开始 按 原 方向 回 退 到 前 一 个 像素 ， 然 后 顺 时 针 扫描 周围 的 八 个 像素 ， 如 果 遇 到 黑色 像素 ， 标 记 之 后 重复 上 述 动作 ， 直 到 遇 到 起 始 标记 像素 则 结束 ， 代 码 如 下 。 


PixelPoint currentP = null; 


» 


while (! samePixel (currentP, startP) ) 


f (currentP == null) 


=~ H- 


// 初始 化 开始 像素 ， 回 退 到 上 一 个 像素 

int xp = startP.getX () ; 

int yp = startP.getY () ; 

yp = yp + 1; 

int gr = getPixel (inPixels, width, height, xp, yp) ; 
currentP = new PixelPoint (yp, xp, gr) ; 
currentP.setLabel (P6) ; 


else 


int position = currentP.getLabel () ; 
int xp = currentP.getX () ; 

int yp = currentP.getY () ; 

// 发 现 边 缘 像 素 

if (currentP.getValue () == 0) 

{ // 回 退 

mq.enqueue (currentP) ; 


if (position == P1) 

{ 
yp = yp + 1; 
position = P6; 

} 

else if (position == P2) 

{ 
xp = xp - 1; 
position = P8; 

} 

else if (position == P3) 

{ 
xp = xp - 1; 
position = P8; 

} 

else if (position == P4) 

{ 
yp = yp =- 1; 
position = P2; 

} 

else if (position == P5) 

{ 
yp = yp =- 1; 
position = P2; 

} 

else if (position == P6) 

{ 
xp = xp + 1; 
position = P4; 

} 

else if (position == P7) 

{ 
xp = xp + 1; 
position = P4; 

} 

else // P8 

{ 
yp = yp + Í; 
position = P6; 

} 

} 
else 


{ // 非 边 缘 像 素 ， 顺 时 针 方向 ， 


if (position -- P1) 
{ 


xp = xp + 1; 
position = P2; 

} 

else if (position == P2) 


{ 


xp = xp + 1; 
position = P3; 

} 

else if (position == P3) 


{ 


yp e yp +1; 
position = P4; 


} 


else if (position == P4) 
{ 
yp = yp +1; 
position = P5; 
} 
else if (position == P5) 
{ 
xp = xp - 1; 
position = P6; 
} 
else if (position == P6) 
{ 
xp = xp - 1; 
position = P7; 
} 
else if (position == P7) 
{ 
yp = yp = 1; 
position = P8; 
} 
else 
{ 
yp e yp = 1; 


position = P1; 


} 


} 

// 设 定 当前 像素 值 

int gr = getPixel (inPixels, width, height, xp, yp); 
currentP = new PixelPoint (yp, xp, gr) ; 
currentP.setLabel (position) ; 


4) 对 标记 的 所 有 黑色 像素 着 色 显 示 ， 得 到 对 象 轮廓 。 


// 白色 背景 

Arrays.fill (outPixels, -1) ; 
while (! mq.isEmpty () ) 

{ 


PixelPoint edgePixel = (PixelPoint) mq.dequeue () ; 
int col = edgePixel.getX () ; 

int row = edgePixel.getY () ; 

setPixel (outPixels, width, height, col, row, 0); 


完整 的 基于 Moore-Neighbour 边 缘 跟 踪 算 法 的 轮廓 提取 源 代 码 MooreNeighbourTrace-Algorithm.java 参 见 源 文件 中 的 10-5。 关 于 中 止 条 件 ， 可 以 改 为 两 次 经 过 起 始 像素 点 ， 这 样 大 部 分 的 对 象 都 可 
以 实现 边缘 跟踪 。 


本 节 主 要 介绍 了 两 种 简单 的 对 象 边缘 跟踪 算法 ， 基 于 边缘 跟踪 可 以 实现 连通 组 件 的 轮廓 提取 ， 这 些 都 在 现实 应 用 中 具有 实际 意义 。 


10.6 ”二 值 图 像 细 化 


件 : 


二 值 图 像 细 化 是 图 像 骨 架 提取 的 常用 手段 之 一 ， 可 通过 细 化 得 到 图 像 对 象 骨架 ， 为 下 一 步 处 理 做 好 准备 。 最 常见 的 基于 模板 扫描 方式 的 二 值 图 像 细 化 算法 是 Zhang-Suen thinning 算 法 ， 它 具有 运算 速 


图 10-8 ”入 个 像素 顺序 


定义 P 的 连接 数 Connectivity (P) 为 P2->P9->P2 顺 序 排列 中 所 有 0- > 1 出 现 次 数 、 定 义 P 周 围 黑色 像素 个 数 Black (P) 为 P2~P9 中 黑色 像素 的 数目 。 所 有 黑色 像素 P 满 足下 面 第 一 个 子 迭 代 的 所 有 条 


1) 连接 数目 Connectivity (P) = 1。 

2) 邻 域 中 黑色 像素 数目 2<Black (P) <6。 

3) 至 少 P2、P4、P6 之 中 有 一 个 是 白色 像素 。 

4) 至 少 P4、P6、P8 之 中 有 一 个 是 白色 像素 。 

设置 该 像素 为 白色 像素 。 继 续 对 剩 下 的 黑色 像素 进行 分 析 ， 如 果 满 足 第 二 个 子 迭 代 的 所 有 条 件 : 
5) 连接 数目 Connectivity (P) = 1, 

6) 邻 域 中 黑色 像素 数目 2<Black (P) <6。 

7) 至 少 P2、P4、P8 之 中 有 一 个 是 白色 像素 。 

8) 至 少 P2、P6、P8 之 中 有 一 个 是 白色 像素 。 


设置 该 像素 为 白色 像素 ， 直 到 所 有 的 黑色 像素 经 过 上 述 两 个 子 迭 代 过 程 再 无 改变 ， 则 结束 迭代 ， 细 化 完成 。 编 程 实现 该 算法 大 致 可 以 分 为 如 下 几 步 : 


1) 


2) 


3) 


6) 


7) 


获取 输入 二 值 图 像 像 素数 组 Nx M 大 小 (假设 白色 为 背景 像素 ， 黑 色 为 对 象 组 件 ) 。 
初始 化 像素 ， 计 算 每 个 黑色 像素 的 连接 数目 与 邻 域 中 的 黑色 像素 数目 。 

循环 对 每 个 黑色 像素 完成 第 一 子 迭 代 条 件 检测 ， 符 合 条 件 则 设 像素 值 为 白色 。 
重复 步骤 2。 

循环 对 每 个 黑色 像素 完成 第 二 子 迭 代 条 件 检测 ， 符 合 条 件 则 设 像素 为 白色 。 

循环 步骤 2~ 5 直到 黑色 像素 值 不 再 改变 为 止 。 


输出 处 理 以 后 的 数组 。 


完整 实现 上 述 步 又 的 代码 片段 如 下 : 


// 获取 输入 像素 数组 

pixelList = new ArrayList«ThinPixel» () ; 

int[] inPixels = new int[width*height]; 

int[] outPixels = new int[width*height]; 

getRGB ( src, 0, 0, width, height, inPixels ) ; 
boolean changed - true; 

// 开始 细 化 


while (changed) 


{ 


changed = false; 

// 初始 每 个 黑色 像素 

initPixels (inPixels, width, height) ; 
// 迭代 一 : 条 件 

for (ThinPixel tp : pixelList) 

{ 


f (tp.getValue () == 0) continue; 

nt p246 = tp.getP2 () * tp.getP4 () * tp.getP6 () ; 

t p468 = tp.getP8 () * tp.getP4 () * tp.getP6 () ; 

f ( (tp.getNumOfBlack () »- 2 && tp.getNumOfBlack () «- 6) && 
(p468 == 0) && (p246 == 0) && 
(tp.getNumOfConnectivity () ==1)) { 


i 
i 
i 
i 


setPixel (inPixels, width, height, tp.getCol () , tp.getRow () , 


changed = true; 


} 


} 

// 初始 化 

initPixels (inPixels, width, height) ; 
// Ra: 条 件 检测 


for (ThinPixel tp : pixelList) 
{ 
if (tp.getValue () == 0) continue; 
int p248 = tp.getP2 () * tp.getP4 () * tp.getP8 () ; 
int p268 = tp.getP2 () * tp.getP6 () * tp.getP8 () ; 
if ( (tp.getNumOfBlack () >= 2 && tp.getNumOfBlack () <= 6) && 


(p248 == 0) && 

(p268 == 0) && 

(tp.getNumOfConnectivity () ==1)) { 
changed = true; 


setPixel (inPixels, width, height, tp.getCol () , tp.getRow () , 


} 


} 
// 输出 结果 数组 
Arrays.fill (outPixels, -1) ; 


for (ThinPixel tp : pixelList) 


{ 


int row = tp.getRow () ; 
int col = tp.getCol () ; 
int p = tp.getValue () ; 
f (p--0) 


=~ H- 


else 


} 
setPixel (outPixels, width, height, col, row, p); 


其 中 initPixels 方 法 是 实现 每 个 黑色 像素 的 初始 化 处 理 ， 该 方法 的 代码 如 下 : 


private void initPixels (int[] inPixels, int width, int height) 


{ 


int index = 0; 
pixelList.clear () ; 
for (int row-0; row«height; rowt+) { 
for (int col=0; col«width; col++) { 
index = row * width + col; 
int value = (inPixels[index] >> 16) & Oxff; 
if (value == 255) 
{ 
ThinPixel p = new ThinPixel (row, col, 0) ; // white; 
pixelList.add (p) ; 
} 
else 


{ 


ThinPixel p = new ThinPixel (row, col, 1); // black; 
pixelList.add (p) ; 


} 
} 
for (ThinPixel tp : pixelList) 
{ 


int row = tp.getRow () ; 

int col = tp.getCol () ; 

if (tp.getValue () = 0) continue; 

// 寻找 细 化 目标 像素 点 

int p2 = getPixel (inPixels, width, height, col, row-1) ; 
int p3 = getPixel (inPixels, width, height, col+1， row-1) ; 
int p4 = getPixel (inPixels, width, height, col+l, row) ; 
int p5 = getPixel (inPixels, width, height, col+1， row+1) ; 
int p6 = getPixel (inPixels, width, height, col, rowtl) ; 
int p7 = getPixel (inPixels, width, height, col-1, rowtl) ; 
int p8 = getPixel (inPixels, width, height, col-1, row) ; 
int p9 = getPixel (inPixels, width, height, col-1, row-1) ; 
p2 = p2 = 0? 1: 0; 

p3 = p3 = 0 ? 1 0; 

p4 = p4 = 0 ? 1 0; 

p5 = p5 = 0 ? 1 0; 

po = po = 0? 1 0; 

p/2^p/7-720? 1 0; 

p8 = p8 = 0? 1: 0; 

p9-2p9-220? 1: 0 


int sum = p24p34p44p54p64p74p84p9; 
int times = 0; 
if (p2--0 && p3 == 1) 


timest++; 


255) % 


255).3 


f (p3==0 && p4— 1) 


a Hw 


timest+; 


} 
if (p4--0 && p5 = 1) 


timest++; 


f (p5== 0 && p6--1) 


Aa Hw 


timest+; 


f (p6== 0 && p7==1) 


a H- we 


timest+; 


f (p7— 0 && p8==1) 


—m|--—— 


timest+; 


f (p8— 0 && p9==1) 


— H- ~ 一 


timest++; 


f (p9== 0 && p2==1) 


=~ H- Ww 


times++; 


tp.setNumOfConnectivity (times) ; 
tp.setNumOfBlack (sum) ; 

tp.setP2 (p2) ; 

tp.setP4 (p4) ; 


tp.setP6 (p6) 
tp.setP8 (p8) 


完整 的 Zhang-Suen thinning 算 法 源 代码 参加 源 文件 中 10-6 的 ZhangSuenThinningAlg.java。 实 际 运行 效果 如 图 10-9 所 示 。 


图 10-9 中 ， 左 边 为 输入 文字 ， 右 边 为 细 化 以 后 的 文字 。 


图 10-9 ” 细 化 结果 


10.7 ”计算 连通 区 域 几 何 质心 


在 具体 介绍 计算 方法 之 前 ， 首 先 简单 介绍 一 下 物体 的 几何 质心 概念 。 质 心 就 是 通过 该 点 ， 使 区 域 达 到 一 种 质量 上 的 平衡 状态 。 对 于 质心 的 概念 ， 可 能 物理 学 上 讲 得 比较 多 ， 简 单 地 说 就 是 规则 几何 物体 
的 中 心 ， 不 规则 的 可 以 通过 挂 绳子 的 方法 来 寻找 ， 如 图 10-10 所 示 。 


区 


E 


^ 


图 10-10 ”几何 质心 


1. 基 本 原理 


假设 二 值 图 像 像 素数 组 大 小 为 NxM ， 二 值 图 像 连通 区 域 几何 质心 计算 使 用 如 下 数学 公式 : 


计算 区 域 总 像素 A= 全 祈 


XE, QBI, j] 属 于 该 连通 区 域 ， 则 B[i, jj = 1， 否 则 为 0。 


3 xag) > Yan 
根据 上 述 计算 结果 质心 坐标 为 : Xo- 4 . Yos 1 


这 里 依据 的 数学 模型 是 图 像 Moments，Moments 本 质 上 基于 权重 的 像素 计算 ， 它 对 图 像 中 的 连通 区 域 或 分 割 对 象 的 各 种 属性 计算 非常 实用 。 常 见 的 图 像 Moments 的 表达 式 如 下 : 


M 


基于 Moments 实 现 连通 区 域 质心 计算 的 完整 代码 实现 大 致 可 以 分 为 如 下 几 步 : 


1) 获取 输入 二 值 图 像 像素 数组 。 

2) 通过 连通 组 件 标记 算法 找到 所 有 的 连通 区 域 ， 并 分 别 标记 。 

3) 对 每 个 连通 区 域 计 算 第 0 阶 与 第 1 阶 Moments， 然 后 得 到 质心 坐标 。 
4) 用 不 同 颜色 绘 制 连通 区 域 的 质心 ， 输 出 处 理 后 的 图 像 。 


在 上 述 编程 步骤 中 ， 关 于 第 一 步 与 第 二 步 ， 本 章 已 经 有 详细 介绍 ， 这 里 不 再 袭 述 。 第 三 步 利 用 Moments 计 算 质心 的 实现 代码 如 下 : 


// third step, calculate center point of each region area (connected component) 
int[] input = new int[pixelList.size () ]; 

GeometricMomentsAlg momentsAlg = new GeometricMomentsAlg () ; 
momentsAlg.setBACKGROUND (0) ; 

double[][] labelCenterPos = new double [max] [2]; 

for (int i-1; i<=max; i++) 


{ 


for (int p=0; p<input.length; p++) 
{ 


f (pixelList.get (p) .getLabel () == i) 


=~ H- 


input[p] = pixelList.get (p) .getLabel () ; 
} 


else 
{ 
} 


} 
// 计算 每 个 组 件 的 质心 
labelCenterPos[i-1] = momentsAlg.getGeometricCenterCoordinate (input, width, height) ; 


input[p] = 0; 


其 中 GeometricMomentsAlg 类 是 专门 用 来 计算 Moments 阶 实现 类 的 ， 实 现任 意 Moments 阶 计算 的 方法 代码 如 下 : 


public double moments (int[] pixels, int width, int height, int p, int q) 
1 


double mpg = 0.0; 
int index = 0; 
for (int row-0; row<height; rowt+) 


{ 


for (int col=0; col<width; col++) 


{ 


index = row * width + col; 
f (pixels[index] == BACKGROUND) continue; 
mpq += Math.pow (row, p) * Math.pow (col, q) ; 


H- 


} 


return mpq; 


e 


最 后 一 步 实现 连通 区 域 与 质心 颜色 着 色 的 代码 如 下 : 


// render the each connected component center position 
for (int row=0; row<height; rowt+) { 

for (int col=0; col«width; col++) { 

index = row * width + col; 


if (pixelList.get (index) .getLabel () == 0) 
{ // make it as black for background 
outPixels [index] = (255 << 24) | (0 << 16) | (0 << 8) | 0; 
} 
else 
{ // make it as blue for each region area 
outPixels [index] = (255 << 24) | (0 << 16) | (0 << 8) | 100; 


} 
} 


// make it as white color for each center position 
for (int i-0; i<max; i++) 


{ 


int crow = (int) labelCenterPos[i] [0]; 

int ccol = (int) labelCenterPos[i] [1]; 

index = crow * width + ccol; 

outPixels[index] = (255 << 24) | (255 << 16) | (255 << 8) | 255; 


最 终 输 出 的 图 像 ， 每 个 区 域 为 蓝 色 着 色 ， 质 心 像素 为 白色 表示 。 完 整 计算 连通 区 域 质心 的 实现 类 源 代码 清单 参见 源 文 件 中 10-7 的 AreaCenterFilterjava。 关 于 Moments 计 算 类 的 源 代码 同样 参见 10-7 


的 GeometricMomentsAlg.java。 


10.8 ”计算 连通 区 域 方向 角度 


Moments 的 一 阶 与 零 阶 用 来 计算 图 像 连通 区 域 的 质心 ， 二 阶 可 以 实现 对 图 像 连通 区 域 方向 角度 的 计算 ， 最 终 得 到 的 是 一 个 与 中 心 质点 和 水 平 线 相交 的 夹 角 ， 即 连通 区 域 的 方向 角度 。 


1. 基 本 原理 


计算 连通 区 域 方向 角度 时 ， 同 样 是 基于 图 像 Moments 得 到 的 计算 结果 ， 与 计算 图 像 质心 不 同 ， 角 度 是 基于 二 阶 (p+ q= 2) 图 像 Moments 的 结果 得 到 的 ， 二 阶 Moments 的 结果 除了 可 用 于 计算 角度 之 
外 ， 还 可 以 计算 连通 区 域 的 扁平 程度 E。 同 样 ， 假 设 二 值 图 像 的 像素 数组 为 NxM 大 小 ， 其 计算 扁平 程度 E 表 示 为 公式 : 


E = asın — bsin@cos@ + cecos 


其 中 a、b、c 三 个 分 别 为 图 像 二 阶 Moments 计 算 结果 : 


[| 
A M 
| ITE 


J -一 | 
c = | 


] -1 2b 
假设 a#c， 然 后 根据 反 三 角 函 数 知识 即 可 得 到 连通 区 域 的 角度 6= 2 °°" 4 - <。 同样 进一步 可 以 得 到 


E = ET a+c) 一 a4 a — c) cos20 — bsin20 


b 7 a — cE 
sin2g = + ————————— , cos20 =t 
+(a-e)7 JD 


a 
E 


h^ 


如 果 对 sin26 与 cos296 取 正 值 则 得 到 E 的 最 小 值 Emin， 取 负 值 则 得 到 E 的 最 大 值 Emax。 最 终 得 到 扁平 程度 比率 e=%% ，e 值 越 接 近 零 则 连通 区 域 越 趋 向 线条 状 ，e 值 越 接 近 1 则 连通 区 域 越 趋 向 圆 形 。 从 上 面 公式 


十 (a ge)’ 


max 


可 以 看 出 ， 最 重要 的 是 计算 出 a、b、c 三 个 系数 值 ， 也 就 是 要 对 图 像 每 个 连通 区 域 进行 二 阶 Moments 计 算 ， 然 后 根据 a、b、c 三 个 系数 值得 到 角度 大 小 96 与 扁平 程度 比率 e。 


N 


.实现 步骤 


实现 连通 区 域 角度 方向 6 与 扁平 程度 比率 (roundness ratio) e 计 算 与 结果 显示 的 程序 ， 大 致 需要 如 下 几 步 : 


1) 对 输入 的 二 值 图 像 获 取 像 素数 组 NxM 大 小 。 


2) 通过 连通 组 件 标记 算法 获取 并 标记 每 个 连通 区 域 。 


3) 计算 每 个 连 


4) 根据 每 个 连 


车 通 区 域 的 二 阶 Moments 得 到 a、b、 < 三 个 系数 值 。 


车 通 区 域 的 a9、b、<c 三 个 值 计 算 角 度 方向 6 与 e。 


5) 根据 角度 方向 着 色 显示 二 值 图 像 结果 


在 上 


Jf Whe 
int[] 
Geomet 
momen 


述 步骤 中 ， 关 于 第 一 步 与 第 二 步 ， 本 章 


个 参数 a，D，c， 角度 theta， Emin, Emax 
input = new int[pixelList.size () ]; 
ricMomentsAlg momentsAlg = new GeometricMomentsAlg () ; 
tsAlg.setBACKGROUND (0) ; 


double[][] labelCenterPos = new double[max] [2]; 
double[][] centerAngles = new double[max] [3]; 


for (int i=1; 


i<=max; i++) 


{ 


———Tn€ 7 


{ 


for (int p=0; 


=~ H- 


p<input.length; p++) 


f (pixelList.get (p) .getLabel () == i) 


input[p] = pixelList.get (p) .getLabel () ; 


} 


else 


{ 


input[p] = 0; 


} 


} 
// 计算 每 个 组 件 的 质心 


前 面 已 经 有 详细 介绍 与 实现 ， 第 三 步 计算 图 像 连 通 区 域 二 阶 Moments 得 人 a、b、c 三 个 系数 值 ， 计 算 每 


abe] CenterPos[i-1] = momentsAlg.getGeometricCenterCoordinate (input, width, height) ; 


1 
// 计算 每 个 组 件 的 

double a = momentsAlg.centralMoments (input, width, 
double b = momentsAlg.centralMoments (input, width, 
double c = momentsAlg.centralMoments (input, width, 
double bb = b*b; 

double ac2 = Math.pow ( (a-c) , 2) ; 

double sum = 2 * Math.sqrt (bb + ac2) ; 

double angle - Math.atan ( (2*b) / (a - c) ) /2.0; 
double emax- (atc) /2 - (ac2/sum) - (bb/sum) ; 
double emin= (atc) /2 + (ac2/sum) + (bb/sum) ; 


// 角度 范围 rescale 到 0~180 之 间 
centerAngles 
centerAngles 
centerAngles 


[i-1][0] = angle + Math.PI/2.0; 


[i-1][1] = emax; 


[i-1][2] = emin; 


N/a 
al 


就 可 以 得 到 最 终 的 结果 ， 对 像素 点 着 色 处 理 显示 结果 的 代码 片段 如 下 : 


int labelCount 


{ 


// it is trick, display correct a 


le as you see! ! | 


for (int j=0; j«radius; j++) 
{ 
int drow = (int) (crow - j * sin) ; 
int dcol = (int) (ccol + j * cos) ; 
if (drow >= height || drow <=0 ) continue; 
if (dcol >= width || dcol <=0 ) continue; 
index = drow * width + dcol; 
outPixels[index] = (255 << 24) | (255 << 16) 
} 
int cx = (int) labelCenterPos[i] [1]; 


// 根据 中 心 点 显示 水 平 直线 


for (int px=cx; px«width; pxtt) 


int cy 


= (int) labelCenterPos[i][0]; 


index = cy * width + px; 


outPixe 


ls[index] = (255 << 24) | (255 << 16) 


height, 0, 2) ; 
al . 


height, 


height, 2, 0); 


centerAngles.length; 
for (int i20; i<labelCount; i++) 
System.out.println ("Region " + i+ "'s angle = " + centerAngles[i][0]) ; 
System.out.println ("Region "+ i+" e=" + (centerAngles[i][1]/centerAngles[i][2]) ) ; 
double sin = Math.sin (centerAngles[i][0]) ; 
double cos = Math.cos (centerAngles[i][0]) ; 
System.out.println ("sin = " + sin) ; 
System.out.println ("cos = " + cos) ; 
System.out.printin () ; 
int crow = (int) labelCenterPos [i] [0] 
int ccol = (int) labelCenterPos[i] [1]; 
int radius = (int) centerAngles[i] [1] 
ng 


(255 << 8) | 0; 


(255 << 8) | 0; 


述 着 色 处 理 中， 根据 角 度 计 算出 每 个 需要 着 色 的 像素 ， 只 是 简单 的 三 角 函 数 知识 的 运用 ， 而 且 都 是 从 质心 开始 出 发 的 ， 所 以 很 容易 计算 。 完 整 


10.9 


本 章 介 绍 了 二 值 图 像 的 基本 概念 、 采 样 问题 ， 
个 处 理 方法 都 给 出 详细 的 步骤 分 析 与 代码 实现 ， 做 到 理论 与 实践 相 结合 。 


此 外 ， 本 章 


小 结 


介绍 了 一 些 常见 的 算 


更 好 地 学 习 与 掌握 本 章 知识 ， 建 议 读者 进一步 阅读 相关 资料 。 


法 应 用 ， 比 如 图 的 广度 与 深度 搜索 、 递 归 方法 应 用 ， 相 天数 学 知识 的 介绍 主要 基于 卷 积 Moments 计 算 与 三 角子 


的 计算 连 
10-8 的 AreaOrientationFilterjava。 代 码 已 经 经 过 测试 ， 读 者 也 可 以 运行 修改 。 关 于 图 像 Moments 计 算 图 像 角度 方向 的 内 容 就 介绍 到 这 里 ， 感 兴趣 的 读者 可 以 自己 进 一 


9 数 的 相 天 知识 。 


个 连通 区 域 的 角度 6 与 Emax、 Emin 的 代码 片段 如 下 : 


3 leg, 所 以 对 得 到 的 角度 值 要 加 上 Try2 使 得 最 终 角度 6 的 取 值 范围 为 [0，T] 之 间 。 根 据 得 到 的 角度 6 与 Emax、Emin 的 值 ， 对 输入 像素 进行 适当 的 着 色 处 理 


通 区 域 方向 角度 的 类 源 代码 参见 本 书 源 文 件 中 


步 阅 读 相 关 资 料 。 


然后 由 浅 入 深 地 介绍 了 二 值 图 像 的 泛 洪 填充 、 连 接 组 件 标 记 、 边 缘 跟 踪 提 取 、 骨 架 细 化 、 组 件 几 何 中 心计 算 与 方向 角度 等 二 值 图 像 常见 的 处 理 方法 。 对 每 


这 些 数学 知识 的 了 解 与 掌握 有 助 于 读者 


第 11 章 ”图 像 形态 学 


上 一 章 介绍 了 二 值 图 像 处 理 的 相关 知识 ， 在 实际 应 用 中 ， 二 值 图 像 有 一 类 重要 处 理 方法 ， 就 是 基于 图 像 形 态 学 的 处 理 。 图 像 形 态 学 操作 是 图 像 像素 集合 的 结构 化 操作 ， 常 见 的 为 二 值 图 像 与 灰 度 图 像 ， 
为 了 减少 不 必要 的 复杂 性 ， 本 章 所 讲 的 各 种 形态 学 操作 都 是 以 二 值 图 像 为 对 象 的 。 


首先 从 形态 学 的 基本 概念 一 腐蚀 与 膨胀 开始 ， 进 而 讲解 开 闭 操作 、 基 于 形态 学 的 边缘 检测 、 距 离 变换 与 骨架 提取 、 区 域 填 充 等 知识 ， 这 些 知 识 的 学 习 将 进一步 帮助 读者 提高 对 二 值 图 像 处 理 的 认 知 水 
平 。 同 样本 章 每 个 知识 点 的 内 容 介绍 会 涉及 一 些 数学 上 集合 的 基本 概念 与 知识 ， 提 前 学 习 与 掌握 简单 的 数学 集合 操作 基本 概念 与 知识 有 助 于 读者 更 好 地 理解 本 章 内 容 。 


11.1 ”像素 集合 操作 


图 像 形 态 学 是 指 基 于 像素 集合 结构 化 操作 实现 图 像 的 各 种 处 理 ， 在 具体 介绍 形态 学 处 理 之 前 ， 首 先 介绍 一 下 像素 集合 各 种 操作 的 定义 与 数学 表示 。 如 果 把 图 像 像素 数组 看 成 一 个 集合 ， 常 见 的 集合 操作 
并 、 交 、 补 、 差 、 反 等 都 可 以 基于 像素 集合 完成 。 假 设 A 与 B 是 两 个 集合 ， 且 像素 点 a 在 集合 A 之 中 ， 那 么 为 aEA， 如 果 像 素 点 a 不 在 集合 A 中 则 表示 为 入 A， 如 果 在 A 中 的 每 个 像素 点 同时 也 在 B 中 ， 则 A 可 以 
看 成 B 的 子 集 ， 表 示 为 ACB。 本 节 所 有 关于 集合 的 操作 前 提 是 假设 像素 数组 大 小 为 NxM， 像 素 点 索引 p = x+ Ny， 其 中 x 与 y 分 别 是 列 与 行 索 引 。 


1. 集 合 操作 : 并 
集合 并 操作 可 以 表示 C = AUB， 其 中 集合 A 与 集合 B 是 如 图 11-1 所 示 的 两 张 二 值 图 像 的 像素 数组 集合 。 


其 中 黑色 像素 表示 为 零 ， 白 色 像素 表示 为 1 (255) 。 并 操作 完成 以 后 ， 得 到 的 结果 如 图 11-3 所 示 。 


图 11-1 像素 集合 A 


图 11-2 像素 集合 B 


E11-3 ”并 操作 


实现 集合 A 与 B 并 操作 的 代码 如 下 : 


// 集合 并 操作 
if (getOperatorType () == UNION) 
{ 


if (gl «127 && g2 < 127) 
continue; 


output [index] = -1; // make it white 


因为 原 图 像 A 与 B 在 绘制 时 使 用 了 反 饥 齿 边缘 ， 边 缘 像素 没有 真正 的 二 值 化 ， 所 以 上 面 的 代码 中 ， 假 设 像素 值 低 于 127 为 黑色 像素 ， 不 做 处 理 。 


集合 A 与 B 的 交 操 作 结果 可 以 表示 为 : D=4 N B= plp c 4 and pe 81， 在 某 些 情况 下 集合 A 与 B 可 能 没有 包含 共同 元 素 ， 这 时 4 N 8= 信 为 空 集 。 假 设 A 与 B 是 二 值 图 像 像 素数 组 ， 其 交集 可 以 表示 是 为 D 


=A and B， 其 中 像素 p= where (A and B) 。 假 设 二 值 图 像 A、B 分 别 为 图 11-1 与 图 11-2， 则 交集 操作 以 后 的 结果 为 图 11-4。 


图 11-4” 交 操作 


实现 集合 A 与 B 交 操作 的 代码 如 下 : 


// 集合 交 操 作 
else if (getOperatorType () == INTERSECTION) 


if (g1 > 127 && g2 > 127) 

output[index] = -1; // make it white 
else 

continue; 


3. 集 合 操作 : 补 


假设 图 11-1 的 全 部 像素 集合 为 6， 其 中 白色 对 象 集合 为 A， 则 A 集合 的 补 操作 结果 为 : Ac= "iw e 5 andv e 4 ， 其 中 w 表 示 为 图 像 像素 点 。 在 实际 图 像 处 理 中 ， 集 合 补 操作 可 以 通过 像素 取 反 实现 ， 即 0 
取 值 为 255，255 取 为 0 作为 结果 输出 。 对 图 11-1 进 行 集合 补 操作 的 结果 如 图 11-5 所 示 。 


图 11-5” 补 操 作 
这 里 为 了 显示 需要 ， 把 白色 像素 值 从 255 降 低 到 200。 实 现 集合 补 的 代码 如 下 : 


// 集合 补 操作 
else if (getOperatorType () == COMPLEMETNT) 
{ 


f (gl > 127) 


a H- 


output [index] = -16777216; 
} 


else 


{ 
} 


output [index] = (Oxff << 24) | (200 << 16) | (200 << 8) | 200; 


假设 有 集合 A 与 B， 其 差 操 作 可 以 表示 为 : 


A-D-|iw|wecAanduwu g 


从 上 面 可 以 看 到 ， 二 值 图 像 集 合 差 操 作 表 示 A 与 B 的 补 的 交集 ， 若 A 与 B 分 别 为 图 11-1 与 图 11-2， 则 差 操作 以 后 的 结果 如 图 11-6 所 示 。 


图 11-6” 差 操作 
实际 二 值 图 像 A 与 B 集 合 差 操作 的 代码 如 下 : 


// 集合 差 操 作 
else if (getOperatorType () == DIFFERENCE) 


{ 
// 求 补 
if (g2 > 127) 
{ 


255; 


// RE 
if (g1 > 127 && g2 > 127) 

output [index] = -1; // make it white 
else 

continue; 


常见 的 二 值 图 像 集 合 操作 并 、 交 、 补 、 差 就 介绍 到 这 里 ， 图 像 形态 学 的 大 部 分 操作 都 是 基于 这 些 集合 操作 或 与 之 类 似 的 操作 完成 二 值 图 像 处 理 的 。 完 整 的 二 值 图 像 集合 操作 源 代码 参见 源 文件 中 11-1 里 
的 SetOperatorFilter.java， 运 行 与 测试 的 图 像 为 A-Set.png 与 B-Set.png.。 


11.2 腐蚀 与 膨胀 


1. BER E 


腐蚀 与 膨胀 是 最 基础 的 图 像 形态 操作 ， 腐 蚀 与 膨胀 都 是 基于 集合 交 操 作 的 ， 它 使 用 结构 元 素 与 图 像 像素 集合 做 处 理 得 到 最 终结 果 。 假 设 A 为 图 像 像素 集合 ， 图 像 B 为 结构 元 素 ， 则 膨胀 操作 可 以 表示 为 : 


B = |s|((B), N 2 


也 就 是 说 ， 集 合 B 在 A 上 移动 ， 得 到 的 交集 不 为 空 时 ， 设 像素 点 s 为 对 象 像素 255， 则 A 表示 二 值 图 像 中 白色 对 象 像素 点 集合 。 通 常 图 像 膨胀 操作 有 如 下 功能 : 


“对象 大 小 增加 一 个 像素 。 
. 平滑 对 象 边缘 。 
. 减少 或 填充 对 象 之 间 的 距离 或 者 对 象 上 小 孔 。 


假设 结构 元 素 为 3x3 大 小 ， 实 现 图 像 脱 胀 操 作 的 代码 如 下 : 


// 结构 元 素 宽 与 高 
int seh = this.getStructureElements () .length/2; 
int sew = this.getStructureElements () .length/2; 
Arrays.fill (output, -16777216) ; // black 
// 膨胀 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
boolean found = false; 
for (int er--seh; er<=seh; er++) 


int nrow = row + er; 
for (int ec--sew; ec<=sew; ect) 


{ 


int ncol = col + ec; 

int gl = getPixel (setA, width, height, ncol, nrow) ; 
if (g1>127) 

{ 


found = true; 
break; 
} 


f (found) break; 


f (found) {// B 与 AS 有 交集 ， 中 心 像素 设 为 白色 
output[index] = -1; // make it white 


H- =~ 


H- =~ 


ce 


2. 腐 蚀 操 作 

腐蚀 操作 就 是 结构 元 素 B 在 图 像 A 上 移动 ， 若 B 中 对 应 的 每 个 对 象 像素 都 同时 属于 A 则 保留 ， 否 则 丢弃 该 像素 。 腐 蚀 操作 可 以 表示 为 492 = s(00.C 4 ， 腐 蚀 操 作 具 有 如 下 功能 : 
. 对 象 大 小 减 小 一 个 像素 。 

. 平滑 对 象 边缘 。 

. 弱化 或 分 割 对 象 之 间 的 半岛 型 连接 。 


假设 结构 元 素 为 3x3 大 小 ， 则 实现 图 像 腐蚀 操作 的 代码 如 下 : 


// 结构 元 素 宽 与 高 
int seh = this.getStructureElements () .length/2; 
int sew = this.getStructureElements () .length/2; 
Arrays.fill (output, -16777216) ; // black 
// 腐蚀 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
// int cg = getPixel (setA, width, height, col, row) ; 
boolean found = false; 
for (int er--seh; er<=seh; er++) 


{ 


int nrow = row + er; 
for (int ec=-sew; ec<=sew; ect) 


{ 


int ncol = col + ec; 
int gl = getPixel (setA, width, height, ncol, nrow) ; 
if (g1«127) 


{ 


found = true; 
break; 
} 


f (found) break; 


f (! found) {// B 与 A 有 交集 ， 中 心 像 素 设 为 白色 
output[index] = -1; // make it white 


H- ~ 一 


H- ~ 一 


3. 边 绿 提取 


使 用 膨胀 与 腐蚀 操作 实现 二 值 图 像 中 对 象 边缘 提取 时 ， 假 设 A 为 二 值 图 像 集合 ， 其 中 黑色 背景 像素 值 为 0%， 则 对 象 集合 A={p (x, y) |p (x, y) #0 且 P (x, y) EA 介 。 利 用 集合 操作 得 到 的 对 象 边 缘 像 素 
集合 为 8(4) = 4 (408) ， 其 中 ， 结 构 元 素 B 为 3x3 大 小 。 可 以 看 出 图 像 形 态 学 提取 二 值 图像 对 象 边 缘 就 是 求 得 腐蚀 操作 的 结果 并 取 反 ， 之 后 再 与 原来 的 A 进行 集合 交 操作 ， 其 结果 即 为 二 值 图 像 中 对 象 边 
缘 。 基 于 上 述 集合 操作 原理 ， 实 现 二 值 图 像 中 对 象 边缘 提取 的 代码 如 下 : 


// 腐蚀 操作 
BufferedImage erosionImage = super.filter (src, null) ; 
// 获取 腐蚀 操作 之 后 的 像素 集合 与 原 像素 集合 

int[] setA = new int[width*height]; 

[] setB = new int[width*height]; 

[] output = new int[width*height]; 


Q EB 
O 
ET cr CT ¢ ( $ 


tRGB ( src, 0, 0, width, height, setA ) ; 
getRGB ( erosionImage, 0, 0, width, height, setB ) ; 
int index = 0; 
// black 


Arrays.fill (output, -16777216) ; 
// 提取 边缘 


for (int row = 0; row < height; rowt+) { 


for (int col = 0; col < width; col++) { 
index = row * width + col; 
int pa = getPixel (setA, width, height, col, row) ; 
int pb = getPixel (setB, width, height, col, row) ; 
if (pa < 127) continue; 
// 对 B 求 补 
if (pb > 127) 
{ 


pb = 0i 


pb = 255; 
} 
// 设置 边缘 像素 为 白色 
if (pb == 255) 
{ 


} 


output[index] = -1; 


实际 运行 的 效果 如 图 11-7 所 示 。 


在 图 11-7 中 左边 为 原 图 ， 右 边 为 提取 图 像 边缘 之 后 的 结果 。 完 整 的 二 值 对 象 边 缘 提取 类 BoundaryExtractionFilterjava 的 源 代码 参见 源 文件 中 的 11-2。 


图 11-7 轮廓 提取 


二 值 图 像 中 的 对 象 腐蚀 可 以 看 成 是 对 背景 颜色 的 膨胀 过 程 ， 但 是 腐蚀 过 程 绝 对 不 是 膨胀 过 程 的 反 操作 ， 而 且 腐 蚀 与 膨胀 都 可 以 根据 实际 需要 使 用 不 同 的 结构 元 素 ， 从 而 得 到 不 同 的 处 理 结果 。 此 外 ， 进 


{FE 
行 过 腐蚀 或 膨胀 操作 的 图 像 可 以 继续 进行 相同 的 操作 ， 可 通过 此 方法 比较 多 次 腐蚀 或 膨胀 与 一 次 腐蚀 或 膨胀 之 间 的 差异 ， 从 而 更 好 地 理解 本 节 内 容 。 本 节 中 实现 膨胀 与 腐蚀 类 的 源 代码 参见 源 文 件 中 11-2 里 
的 DilationFilter.java 与 ErosionFilter.java， 运 用 与 测试 使 用 的 图 为 图 11-1。 


11.3” 开 闭 操作 


图 像 处 理 中 的 开 闭 运算 是 两 个 非常 重要 的 数学 形态 学 操作 ， 它 们 同时 都 继承 自 基 本 的 腐蚀 与 膨胀 操作 ， 这 些 操作 一 般 都 会 应 用 在 二 值 图 像 的 分 析 与 处 理 上 。 


1. 开 操作 


开 操 作 有 扣 像 腐蚀 操作 ， 可 用 于 去 除 对 象 像素 边缘 ， 但 是 不 会 像 腐蚀 操作 一 样 去 除 那么 多 的 边缘 像素 。 开 操作 主要 用 来 去 除 其 他 不 符合 结构 元 素 的 前 景区 域 像素 ， 同 时 保留 结构 。 开 操作 的 定义 是 一 个 
腐蚀 操作 再 接着 一 个 膨胀 操作 ， 两 个 操作 使 用 相同 的 结构 元 素 。 其 中 结构 元 素 形状 根据 开 操作 的 要 求 不 同 ， 结 构 元 素 可 以 是 圆 形 、 正 方形 、 和 矩形 等 。 开 操作 可 以 表示 为 : 


Aob = (AOE) DB 


即 先 腐蚀 后 膨胀 ， 其 中 B 为 结构 元 素 。 实 现 二 值 图 像 开 操作 的 代码 如 下 : 


// 腐蚀 操作 

src = super.filter (src, null) ; 

// 获取 腐蚀 操作 之 后 的 像素 集合 与 原 像 素 集合 
int[] setA = new int[width*height]; 


int[] output = new int[width*height]; 

getRGB ( src, 0, 0, width, height, setA ) ; 

int index - 0; 

// 结构 元 素 宽 与 高 

int seh = this.getStructureElements () .length/2; 
int sew — this.getStructureElements () [0].length/2; 
Arrays.fill (output, -16777216) ; // black 


for (int row = 0; row < height; rowt+) { 

for (int col = 0; col < width; col++) { 
index = row * width + col; 
boolean found = false; 

for (int er--seh; er<=seh; ert++) 


int nrow = row + er; 
for (int ec--sew; ec<=sew; ect) 


{ 


int ncol = col + ec; 

int gl = getPixel (seta, width, height, ncol, nrow) ; 
if (gl>127) 

{ 


found = true; 
break; 
} 


H- =~ 


f (found) break; 


H- Ww 


f (found) {// B 与 A 有 交集 ， 中 心 像素 设 为 白色 
output[index] = -1; // make it white 


完整 的 开 操作 类 OpenFilterjava 的 源 代码 参见 源 文件 中 的 11-3， 为 了 减少 不 必要 的 代码 编写 ， 这 里 的 开 操 作 类 OpenFilter 继 承 了 源 文件 中 11-2 里 的 腐蚀 类 ErosionFilter。 图 11-8 是 基于 不 同 的 结构 元 素 
对 二 值 图 像 处 理 结果 的 实例 。 


图 11-8” 开 操作 


其 中 最 左边 是 原 二 值 图 像 ， 中 间 是 基于 5x 5 的 结构 元 素 开 操作 结果 ， 右 边 是 基于 30x 2 的 结构 元 素 开 操作 结果 。 人 在 上 述 代码 中 计算 结构 元 素 的 高 与 宽 时 ， 若 结构 元 素 高 度 或 宽度 为 1， 则 容易 发 生 误差 ， 
所 以 更 精确 地 获取 结构 元 素 宽 与 高 的 代码 如 下 : 


int seh = (int) (this.getStructureElements () .length/2.0f + 0.5f) ; 
int sew = (int) (this.getStructureElements () [0].length/2.0f + 0.5f) ; 


根据 新 的 she 与 sew 的 值 可 知 ， 上 述 代 码 中 的 结构 元 素 循环 也 需要 做 出 适当 的 改变 ， 新 的 结构 元 素 循环 完成 集合 操作 代码 如 下 : 


for (int er--seh; er< (this.getStructureElements () .length-seh) ; er++) 
int nrow = row + er; 
for (int ec--sew; ec< (this.getStructureElements () [0].length - sew) ; ec++) 
{ 
int ncol = col + ec; 
int gl = getPixel (set, width, height, ncol, nrow) ; 
if (gl>127) 


{ 


found = true; 
break; 
} 
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f (found) break; 


完整 的 二 值 图 像 开 操作 代码 参见 源 文件 中 的 OpenFitterjava 即 可 。 从 上 述 例子 也 可 以 看 出 图 像 开 操作 有 根据 结构 元 素 选择 匹配 形状 对 象 功能 。 


2. 闭 操作 


闭 操作 是 图 像 形态 学 中 的 重要 操作 之 一 ， 闭 操作 也 是 基于 腐蚀 与 膨胀 的 基于 操作 组 合 而 成 的 ， 可 以 运用 于 二 值 图像 或 灰 度 图 像 。 闭 操作 的 作用 是 保留 背景 区 域 与 结构 元 素 形状 相似 的 像素 ， 去 掉 其 他 不 


Fg 
符合 的 背景 区 域 。 闭 操作 是 首先 运用 结构 元 素 完成 膨胀 操作 ， 根 据 得 到 的 结果 再 进行 腐蚀 操作 ， 可 以 表示 为 
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其 中 B 表 示 为 结构 元 素 ，A 表 示 二 值 图 像 像素 集合 。 实 现 二 值 图 像 财 操作 的 代码 如 下 : 


// 膨胀 操作 

src = super.filter (src, null) ; 

// 获取 腐 仔 控 作 之 后 的 像素 集合 与 原 像素 集合 
int[] setA = new int[width*height]; 


int[] output = new int[width*height]; 
getRGB ( src, 0, 0, width, height, setA ) ; 
int index - 0; 
// 结构 元 素 宽 与 高 
int seh = (int) (this.getStructureElements () .length/2.0f + 0.5f) ; 
int sew = (int) (this.getStructureElements () [0].length/2.0f + 0.5f) ; 
Arrays.fill (output, -16777216) ; // black 
// 腐蚀 操作 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
boolean found = false; 
for (int er--seh; er< (this.getStructureElements () .length-seh) ; er++) 


int nrow = row + er; 
for (int ec--sew; ec< (this.getStructureElements () [0].length - sew) ; ec++) 


{ 


int ncol = col + ec; 

int gl = getPixel (setA, width, height, ncol, nrow) ; 
if (gl«127) 

{ 


found = true; 
break; 


} 
f (found) break; 


f (! found) {// B 与 A 有 交集 ， 中 心 像 素 设 为 白色 
output[index] = -1; // make it white 
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为 了 减少 重复 代码 ， 闭 操作 同样 继承 了 前 面 的 DilationFilter 类 。 基 于 闭 操 作 使 用 10x 10 的 结构 元 素 ， 对 close.png 二 值 图 像 处理 的 结果 如 图 11-9 所 示 。 


图 11-9 ” 闭 操 作 结 果 


在 图 11-9 中 ， 左 边 为 二 值 图 像 ， 右 边 为 处 理 以 后 的 结果 。 完 整 的 闭 操 作 源 代 码 参见 源 文件 中 的 CloseFilterjava 即 可 ， 闭 操作 还 可 以 用 来 选择 性 填充 图 像 背 景区 域 。 


11.4 ”Hit-and-Miss 变 换 操 作 


在 图 像 形 态 学 中 ，Hit-and-Miss 变 换 常 被 用 来 匹配 指定 形状 的 二 值 图 像 中 的 对 象 ， 它 由 一 些 基本 的 二 值 图 像 操作 组 合 而 成 ， 跟 腐蚀 与 膨胀 不 同 的 是 ，Hit-and-Miss 的 结构 元 素 中 既 包括 前 景 像素 ， 也 包 
括 背 景 像素 ， 如 果 结 构 元 素 中 没有 指明 前 景 像素 或 背景 像素 ， 则 表示 二 者 都 可 以 ， 图 11-10 为 一 个 这 样 的 结构 元 素 示例 。 


图 11-10 “结构 元 素 
其 中 0 表示 背景 像素 黑色 ，1 表 示 前 景 像 素 白色 ， 灰 度 表示 忽略 。 
1. 操 作 定 义 与 原理 


在 涉及 具体 的 编程 实现 方法 ， 以 及 介绍 Hit-and-Miss 变 换 是 由 哪些 基本 图 像 形 态 学 操作 组 成 的 之 前 ， 首 先 定义 一 下 什么 是 Hit， 什 么 是 Miss。 当 结构 元 素 B 在 指定 的 二 值 图 像 像素 集合 上 发 生 重 赤 时 称 为 
Hit， 当 结构 元 素 B 与 指定 二 值 图 像 像素 集合 完全 没有 重 赤 时 称 为 Miss， 假 设 有 二 值 图 像 集合 A， 结 构 元 素 W， 其 中 其 前 景 元 素 集合 B1， 背 景 元 素 集合 B2。 则 Hit 操 作 可 以 表示 为 : A9B1，Miss 操 作 则 可 以 表 


mA: ACOB2?， 完 整 的 Hit-and-Miss 变 换 表 示 为 : 


A69 B = (AOB,) ALA OB, 


其 实质 是 根据 模板 的 精准 匹配 ， 图 11-10 中 的 模板 可 以 用 来 寻找 二 值 区 域 的 左下 角 像 素 点 。 基 于 图 11-10 实 现 Hit-and-Miss 操 作 得 到 的 结果 如 图 11-11 所 示 (左边 为 二 值 图 像 ， 右 边 是 Hit-and-Miss 操 作 


图 11-11 基于 结构 元 素 操作 之 后 


2. 代 码 实 现 


首先 对 图 像 进 行 二 值 化 处 理 ， 处 理 以 后 获取 图 像 像 素数 据 ， 归 一 化 为 0 表示 黑色 背景 像素 ，1 表 示 白 色 对 象 像素 。 在 定义 的 结构 元 素 模 板 中 ，0 表 示 黑 色 像 素 ，1 表 示 白 色 像 素 ，2 表 示 既 可 以 为 0 也 可 以 为 
1。 本 节 中 使 用 的 模板 为 图 11-10。 完 整 的 Hit-and-Miss 操 作 编 程 实现 步骤 如 下 : 


1) 获取 输入 图 像 ， 完 成 二 值 化 ， 这 里 继承 了 第 6 章 的 二 值 图 像 处 理 类 BinaryFilter。 
2) 获取 像素 并 归 一 化 。 

3) Hit-and-Miss 操 作 ， 发 现 关键 像素 点 。 

4) 输出 结果 图 像 。 


基于 上 述 四 步 的 代码 实现 片段 如 下 : 


int width = src.getWidth () ; 
int height = src.getHeight () ; 
if ( dest == null ) 
dest = createCompatibleDestImage ( src, null ) ; 
// 三 值 化 
src = super.filter (src, null) ; 
int[] setA = new int[width*height]; 
int[] output = new int[width*height]; 


[] 
// 像素 归 一 化 
getRGB ( src, 0, 0, width, height, setA ) ; 
for (int i-0; i<setA.length; i++) 
{ 


= (setA[i] >> 16) & Oxff; 


int tr 
Ali] = tr / 255; 


Sel 


} 

// 获 取 中 心 元 素 颜色 - 和 白色 为 1， 黑色 为 0 

int index - 0; 

int total = countZeroAndOne () ; 

Arrays.fill (output, -16777216) ; 

// 结构 元 素 宽 与 高 

int rr = template.length/2; 

int rc = template[0].length/2; 

// 腐蚀 操作 ， 初始 化 

for (int row = 0; row < height; rowt+) { 

for (int col = 0; col < width; col++) { 
index = row * width + col; 
int count = 0; 

for (int trow--rr; trow<=rr; trowt+) 


{ 


f ( (row + trow) < 0 || (row + trow) >= height) 


a H- 


continue; 
} 
for (int tcol--rc; tcol«-rc; tcol++) 


{ 


if ( (col + tcol) «0 || (col + tcol) >= width) 
continue; 

i (template[trow-rr][tcol4rc] == 2) 

l continue; 

~ index2 = (col+tcol) + (rowttrow) * width; 
if (setA[index2] == template[trowtrr] [tcol+rc] ) 

l count++ ; 


} 
} 


f (count == total) 
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output [index] = -1; 


} 


setRGB (dest, 0, 0, width, height, output) ; 
return dest; 


其 中 方法 countZeroAndOne () 是 用 来 计数 模板 中 前 景 与 背景 像素 个 数 的 ， 其 实现 代码 如 下 : 


private int countZeroAndOne () 
{ 
int count = 0; 

for (int i=0; i<template.length; i++) 
{ 


for (int j=0; j«template[i].length; j++) 
{ 


f (template[i][j] == 1 || template[i][j] == 0) 


=~ H- 


count++; 


} 
} 


return count; 


完整 的 Hit-and-Miss 变 换 源 代码 HitAndMissFilter.java 参 见 源 文件 中 的 11-4 即 可 。 


11.5 “距离 变换 


1. 距 离 变换 概述 


距离 变换 是 二 值 图 像 处 理 与 操作 中 常用 的 手段 ， 在 骨架 提取 、 图 像 窒 化 中 常 有 应 用 。 距 离 变换 的 结果 是 得 到 一 张 与 输入 二 值 图 像 类 似 的 灰 度 图 像 ， 但 是 灰 度 值 只 出 现在 前 景区 域 ， 并 且 越 远离 背景 边缘 
的 像素 灰 度 值 越 大 。 根 据 度 量 距离 的 方法 不 同 ， 距 离 变 换 的 结果 稍 有 不 同 ， 假 设 两 个 像素 点 P1 (x1，y1) 与 pz (x2, yo ， 常 见 的 距离 计算 方法 有 如 下 几 种 。 


- 欧 几 里 得 距离 公式 : Distance=V(% 739) + (7) 
- 曼哈顿 距离 公式 : Distance=lm ^ 1+ lyi - vil 
. 象棋 格 距离 公式 : Distance max |x; - x]. [yi - D 


一 旦 选择 了 距离 度量 公式 ， 就 可 以 在 二 值 图 像 的 距离 变换 中 使 用 了 。 二 值 图 像 的 距离 变换 方法 有 很 多 ， 这 里 基于 形态 学 腐蚀 操作 来 实现 距离 变换 ， 主 要 是 利用 腐蚀 操作 的 特点 每 次 腐蚀 一 个 像素 前 景 边 
缘 像 素 ， 从 而 最 终 得 到 基于 距离 的 像素 梯度 ， 腐 名 操作 的 停止 条 件 是 所 有 前 景 像素 都 被 完全 腐蚀 。 这 样 根据 腐蚀 的 先后 顺序 ， 我 们 就 得 到 了 各 个 前 景 像素 点 到 前 景 中 心 骨架 像素 点 的 距离 。 将 各 个 像素 点 的 
距离 值 设置 为 不 同 的 灰 度 值 ， 这 样 就 完成 了 二 值 图 像 的 距离 变换 。 通 常 腐蚀 操作 可 以 支持 各 种 结构 元 素 ， 而 对 于 通过 腐蚀 实现 距离 变换 来 说 ， 最 好 的 结构 元 素 就 是 3x 3 大 小 的 窗口 模板 。 


2. 代 码 实 现 (基于 腐蚀 ) 

基于 形态 学 腐蚀 操作 实现 距离 变换 操作 的 代码 实现 大 致 可 以 分 为 如 下 几 步 : 

1) 二 值 图 像 灰 度 值 初始 化 ， 全 部 像素 点 初始 化 灰 度 值 为 0。 

2) 基于 腐蚀 生成 图 像 前 景 边缘 集合 。 

3) 基于 前 景 边缘 腐蚀 生成 背景 边缘 集合 。 

4) 迭代 对 每 个 前 景 边缘 像素 计算 距离 ， 然 后 放 入 背景 边缘 集合 中 ， 检 查 背 景 边缘 中 的 每 个 像素 点 的 八 邻 域 像 素 点 ， 如 果 发 现 有 前 景 像素 点 ， 则 加 到 前 景 边缘 像素 集合 
5) 直到 前 景 像素 为 空 ， 才 停止 迭代 。 

6) 根据 每 个 像素 点 的 距离 值 设置 灰 度 值 大 小 ， 输 出 距离 变换 之 后 的 图 像 。 


基于 上 述 步骤 ， 初 始 化 部 分 的 代码 如 下 : 


this.scaleValue = scaleValue; 
this.offsetValu offsetValue; 
this.inputImage = src; 
this.width = src.getWidth () ; 

this.height - src.getHeight () ; 

int[] inPixels = new int[width*height]; 

getRGB ( src, 0, 0, width, height, inPixels ) ; 
int index - 0; 
pixels2D = new int[height] [width]; // row, column 
greyLevel = new int[height] [width]; 

for (int row=0; row < height; rowt+) 


{ 


for (int col=0; col<width; col++) 


index = row * width + col; 


int grayValue = (inPixels[index] >> 16) & Oxff; 
pixels2D[row] [col] = grayValue; 
greyLevel [row] [col] = 0; 


} 
} 
generateForegroundEdge () ; 
generateBackgroundEdgeFromForegroundEdge () ; 


其 中 ，scaleValue 与 offsetValue 是 用 来 调节 距离 变换 以 后 的 图 像 灰 度 值 的 。 实 现 距 离 变换 部 分 的 代码 如 下 所 示 : 


// calculate the distance here! ! 

int index = 1; 

while (foregroundEdgePixels.size () > 0) | 
distanceSingleIteration (index) ; 
++index; 


Eich, 75ikdistanceSinglelteration () 的 代码 如 下 : 


Iterator«Point» locallterator = foregroundEdgePixels.iterator () ; 
while (localIterator.hasNext () ) 

Point localPoint = new Point ( (Point) localIterator.next () ) ; 
backgroundEdgePixels.add (localPoint) ; 

removePixel (localPoint) ; 

greyLevel[localPoint.y][localPoint.x] = paramInt; 


} 


generateForegroundEdgeFromBackgroundEdge () ; 


根据 距离 变换 结果 调节 灰 度 值 与 输出 结果 的 代码 如 下 : 


// loop the each pixel and assign the color value according to distance value 
for (int row = 0; row < inputImage.getHeight () ; rowt+) { 
for (int col = 0; col < inputImage.getWidth () ; col++) { 
ir (greyLevel [row] [col] > 0) { 


int colorValue = (int) Math.round (greyLevel[row][col] * scaleValue + offsetValue) ; 
colorValue = colorValue > 255 ? 255 : ( (colorValue < 0) ? 0 : colorValue) ; 
this.pixels2D[row] [col] = colorValue; 


} 
} 


} 
// build the result pixel data at here ! ! ! 
if ( dest = null ) 
dest = createCompatibleDestImage (inputImage, null ) ; 
index = 0; 
int[] outPixels = new int[width*height]; 
for (int row-0; row«height; rowt+) { 
int ta = 0, tr» 0, tg=0, to = 0; 
for (int col=0; col«width; col++) { 
index = row * width + col; 
tr = tg = tb = this.pixels2D[row] [col]; 
ta = 255; 
outPixels [index] = (ta << 24) | (tr << 16) | (tg << 8) | tb; 


} 


SetRGB ( dest, 0, 0, width, height, outPixels ) ; 
return dest; 


完整 的 距离 变换 源 代 码 参 见 源 文 件 中 11-5 的 DistanceTransform.java 即 可 。 二 值 图 像 的 距离 变换 实现 方法 还 有 很 多 ， 另 外 一 种 比较 带 见 的 算法 为 Chamfer Distance Transform (CDT) ， 感 兴趣 的 读 
者 可 以 自己 进一步 阅读 与 研究 。 


11.6 “分 水 岭 算 法 


1. 定 义 与 概述 


图 像 分 水 岭 变 换 的 定义 是 基于 图 像 像素 的 灰 度 值 距离 来 说 的 ， 根 据 选取 的 距离 功能 不 同 ， 得 到 的 结果 稍 有 不 同 。 常 见 的 分 水 岭 变 换 分 为 基于 拓扑 距离 与 基于 浸泡 理论 ， 基 于 拓扑 距离 的 分 水 岭 算 法 涉及 
更 多 的 图 的 算法 知识 ， 而 浸泡 理论 的 分 水 岭 算 法 的 定义 相对 简单 ， 主 要 基于 形态 学 知识 。 所 以 结合 本 章 内 容 ， 主 要 介绍 基于 浸泡 理论 的 分 水 岭 算法 定义 。 


基于 浸泡 理论 实现 分 水 岭 变 换算 法 是 由 Vincent 与 Soille 在 1991 提 出 的 ， 算 法 思想 是 假设 灰 度 图 像 D， 其 最 小 与 最 大 灰 度 值 分 别 为 hmin 与 hmax， 且 灰 度 值 从 最 小 值 hmin 开 始 ， 浸 泡 灰 度 值 最 小 的 像素 点 ， 
逐步 升 高 灰 度 值 实现 金地 扩展 ， 对 任意 一 个 灰 度 值 像素 ， 如 果 不 是 现 有 人 金地 的 扩展 就 是 一 个 新 的 侈 地 ,或 者 是 个 分 水 岭 W。 基 于 递归 完成 对 所 有 灰 度 值 处 理 之 后 就 得 到 了 最 终 分 水 岭 像 素 点 集 


Wshe« 


基于 四 邻 域 像 素 举例 说 明 如 图 11-12 所 示 。 


其 中 a 表 示 输 入 3x 3 的 像素 灰 度 值 ， 粗 体 部 分 表示 最 小 灰 度 值 0，b 表 示 h = 0 时 发 现 A 与 B 两 个 盆地 ，<c 表 示 h = 1 时 得 到 侈 地 B 扩 展 与 两 个 被 标记 为 分 水 岭 的 像素 W，d~e 时 ,分 水 岭 像 素 点 W (1, 1) 被 更 
新 并 得 到 最 终 的 两 个 分 水 岭 像 素 W。 


2. 步 骤 与 编码 实现 


浸泡 算法 的 分 水 岭 变换 是 基于 队列 的 ， 首 先 要 对 所 有 像素 进行 初始 化 ， 假 设 任意 一 个 像素 可 以 有 四 种 状态 ， 分 别 为 初始 化 (INIT) 、 未 处 理 (MASK) 、 被 标记 为 分 水 岭 (WSHED) 、 被 标记 为 
Label, 


完成 所 有 像素 的 初始 化 以 后 ， 对 每 个 像素 完成 八 邻 域 寻找 。 然 后 从 灰 度 0 开始 ， 步 长 为 1， 逐 渐 过 渡 到 255 进 行 如 下 几 步 处 理 : 
1) 初始 化 所 有 灰 度 值 等 于 给 定 灰 度 h 的 像素 点 ， 设 置 为 MASK， 如 果 邻 域 像 素 点 被 标记 或 为 分 水 岭 像 素 ， 则 将 该 像素 点 添加 到 队列 中 。 


2) 如 果 队 列 不 为 空 ， 出 列队 列 中 每 个 像素 ， 根 据 条 件 处 理 开始 扩展 侈 地 。 


3) 使 用 DFs 算 法 ， 对 于 给 定 灰 度 h 的 像素 点 ， 如 果 状 态 仍然 是 MASK， 则 标记 新 盆地 。 
4) 根据 上 述 处理 结 果 ， 如 果 最 终 像素 点 被 标记 为 分 水 岭 像素 (WSHED) ， 则 显示 为 白色 ， 得 到 分 水 岭 连 接线 。 


基于 上 述 几 步 ， 浸 泡 实 现 图 像 分 水 岭 变 换 的 代码 片段 如 下 : 


int width = src.getWidth () ; 
int height = src.getHeight () ; 
if ( dest -- null ) 
dest = createCompatibleDestImage ( src, null ) ; 
int[] input = new int[width*height]; 

getRGB ( src, 0, 0, width, height, input ) ; 


int index = 0; 
// 初始 化 每 个 像素 值 
Map<String, 


PixelPoint> pixelMap = new HashMap<String, 


// 直方 图 高 度 


List<PixelPoin 


Map«Integer, 

for (int row 
int tr=0; 

for (int col 


0; 


0; 


eae 


heightMap.put (Integer.valueOf (tr) , 


} 


row < height; 


col < width; 
index = row * width + col; 
(input [index] >> 16) 
PixelPoint pp = new PixelPoint (row, 
pixelMap.put ( (row + ", , pp 
f (heightMap .get (Integer.valueOf (tr) ) 


t>> heightMap = new HashMap< 
row--) { 


col++) { 


» 


& Oxff; 


col, tr) 


) 3 


" + col) 


PixelPoint> () ; 


Integer, 


> 


== null) 


List<PixelPoint>> () ; 


heightMap.get (Integer.valueOf (tr) ) .add (pp) ; 


} 
} 
// 和 八 邻 域 链接 像素 寻找 


for (int row = 0; 


row < height; 


rowt+) { 


for (int col = 0; col < width; col++) { 
index = row * width + col; 
PixelPoint cpp = pixelMap.get (row + ", " + col) ; 
for (int nr--1; nr<2; nr++) 
{ 
if ( (nr+row) «0 || (rowtnr) >= height) 
continue; 
for (int nc--1; nc<2; nct) 
{ 
if ( (nctcol) < 0 || (nctcol) »-width) 
continue; 
int index2 = (rowtnr) * width + nc + col; 
if (index == index2) continue; // skip it 


cpp.getNeighbours () .add (pixelMap.get ( (rowtnr) 


} 


// 初始 化 浸泡 算法 


F 
int curlab = 0; 
int curdist = 0; 
int _watershedPixelCount = 
/ / 开始 浸泡 
for (int h=0; h«256; h++) 
{ ti 
Jl. 


for (PixelPoint pp : 


f (heightMap.get (Integer.valueOf (h) ) 


IFOQueue myQueue - new FIFOQueue () ; 


0j 


null) 


continue; 


F (h) ) ) 


heightMap.get (Integer.valueO! 


pp.setLabelToMASK () ; 


for (PixelPoint neighbourPixel : 
{ 
if (neighbourPixel.getLabel () >= 0) 
pp.setDistance (1) ; 
myQueue.fifo add (pp) ; 
break; 
} 
} 
} 
curdist = 1; 
myQueue.fifo add FICTITIOUS () ; 
// 扩展 盆地 


while (true) 


{ 


PixelPoint p = myQueue. fi 
if (p.isFictitious () ) 


{ 


f (myQueue 


=~ H- 


break; 


} 


else 


{ 


myQueue. fi 


fo remove () ; 


.fifo empty () ) 


T 


fo add FICTITIOUS () ; 


curdist++; 


p = myQueue. fi 


} 
} 
for (PixelPoin 


{ 


Log nk 


fo remove () ; 


p.getNeighbours () ) 


aa 
// 
{ 


=~ H- 


f (q.getDis 
if (q.getDistance () 


f (q.getLabel () 


<= curdist && 
<= curdist && 


tance () 


> 0) 


f (p.isLabelMASK () ) 


Ea Ti 


} 


else if (p.getLabel () 


{ 


} 
} 


else i 


pp.getNeighbours () ) 


(q.getLabel () 
(q.getLabel () 


p.setLabel (q.getLabel () ) ; 


p.setLabelToWSHED () ; 
_watershedPixelCount++; 


f (p.isLabelMASK () ) 


{ 


p.setLabelToWSHED () ; 
_watershedPixelCount++; 


} 
} 


else if (q.isLabelMASK () 


{ 


q.setDistance (curdist+1) ; 
myQueue.fifo add (q) ; 


} 
} 


abe] 


// DFS - tag ] 
f (heightMap. 
for (Pixel 


{ 


H- 


// reset dis 


get (Integer.valueOf (h) ) 


Point maskPxielPoint : heightMap.get (Integer.valueOf (h) ) ) 


for all mask pixel point 


— null) 


&& q.getDistance () 


continue; 


! = q.getLabel () ) 


0) 


+ "T W + 
> 


{// water-shed or tag label 


> 0 
>= 0) ) 


tance to zero 


maskPxielPoint.setDistance (0) ; 


f (maskPxiel 


Point.isLabelMASK () ) 


i 
{ 


curlabt+; 


myQueue. fi 


o add (maskPxielPoint) ; 


maskPxielPoint.setLabel (curlab) ; 
// 组 件 标记 算法 
while (! myQueue.fifo empty () ) 


{ 


PixelPoin 


t q = myQueue. fi 


{ 


for (Pixel 


Point qn : 


f (qn.isLabelMASK () ) 


) 
输出 统计 


a He-Ne 
Fh 


eas ele 


myQueue.fifo add (qn) ; 
qn.setLabel (curlab) ; 


( watershedPixelCount » 0) 


fo remove () ; 
q.getNeighbours () ) 


// new minimum region 


new ArrayList«PixelPoint» () ) ; 


(nc + col) ) ) ; 


|| q.isLabelWSHED () ) ) 


System.out.println (" total watershed pixel count = " + watershedPixelCount) ; 


} 
// 显示 分 水 岭 线 
for (int row = 0; row < height; rowt+) { 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
PixelPoint pp = pixelMap.get (row + ", " + col) ; 
if (pp.isLabelWSHED () && ! pp.allNeighboursAreWSHED () ) 
{ 


input [index] = (255 << 24) | (255 << 16) | (255 << 8) | 255; 


其 中 用 到 的 类 PixelPoint 是 实现 每 个 像素 点 信息 记录 的 数据 结构 ，FIFOQueue 是 基于 LinkedList 的 队列 。 完 整 的 分 水 岭 浸 泡 算 法 源 代码 参见 源 文件 中 的 11-6， 上 述 源 代 码 中 给 出 的 是 基于 八 邻 域 的 寻找 
实现 ， 读 者 可 以 自己 党 试 改 成 四 邻 域 寻找 实现 。 


11.7” 灰 度 图 像 腐蚀 与 膨胀 


本 章 前 面 已 经 介绍 的 形态 学 知识 除了 浸泡 分 水 岭 算法 ， 其 他 都 是 针对 二 值 图 像 进行 处 理 的， 其 实 很 多 时 候 这 些 形 态 学 知识 还 被 扩展 应 用 到 灰 度 图 像 上 ， 实 现 灰 度 图 像 有 很 多 基本 的 形态 学 操作 ， 如 府 


蚀 、 膨 胀 、 开 闭 操 作 等 。 灰 度 图 像 的 形态 学 操作 具有 实际 应 用 意义 ， 在 图 像 分 割 、 重 建 等 方面 均 有 使 用 。 本 节 通 过 介绍 灰 度 图 像 形 态 学 基本 操作 一 一 腐蚀 与 膨胀 ， 帮 助 读者 进一步 拓宽 与 加 深 对 图 像 形 态 学 
处 理 的 认 知 与 理解 。 


1. 结 构 元 素 


对 比 于 二 值 图 像 ， 灰 度 图 像 形态 操作 从 像素 值 的 变化 方法 来 阅 可 以 分 为 两 类 ， 其 中 一 类 为 结构 元 素 中 像素 值 固 定 不 变 而 且 相互 相等 ， 我 们 称 之 为 平坦 结构 元 素 ; 另外 一 类 可 称 为 非 平 坦 结构 元 素 ， 其 结 
构 元 素 中 灰 度 值 是 连续 变化 、 相 互 不 同 的 。 本 节 中 如 果 没 有 特别 说 明 ， 其 结构 元 素 都 基于 平坦 结构 元 素 完成 灰 度 图 像 腐蚀 与 膨胀 。 


2. 腐 蚀 
假设 图 像 f (x，y) 是 灰 度 图 像 ， 平 坦 结构 元 素 b (x, y) 则 基于 平坦 结构 元 素 腐蚀 ， 可 以 表示 为 在 任意 像素 点 p (x，y) 结构 元 素 与 灰 度 图 像 重 晋 的 最 小 值 ， 公 式 表 示 如 下 : 


Ob (x,y) = min f(x s,y +t) 
(s;t)eb 
随 着 x 与 y 变 化 访问 灰 度 图 像 中 的 每 个 像素 ， 最 终 得 到 腐蚀 之 后 的 结果 。 非 平坦 结构 元 素 bN 的 灰 度 图 像 腐 蚀 与 此 类 似 ， 唯 一 不 同 的 是 需要 对 应 减 去 结构 元 素 中 的 灰 度 值得 到 最 小 值 ， 其 公式 表示 如 下 : 
| f@b,|(x,v) = min f(x +s,y +t) - by(s,t) 
[8 ^N 


根据 上 述 定 义 ， 基 于 平坦 结构 元 素 实 现 灰 度 图 像 腐蚀 的 代码 实现 如 下 : 


int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 


dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 


getRGB (src, 0, 0, width, height, inPixels) ; 
int index - 0; 
int s = elements[0].length; 
int t = elements.length; 
int min = 255; 
for (int row = 0; row < height; rowt+) { 
int tg = 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
min = 255; 
for (int subRow-0; subRow<t; SubRow++) 
{ 


int nrow = row + subRow; 
f (nrow < 0 || nrow >= height) 


=~ H- 


nrow = 0; 
} 
for (int subCol-0; subCol<s;  subCol++) 
{ 


int ncol = col + subCol; 
f (ncol < 0 || ncol >= width) 


=~ H- 


ncol = 0; 
} 
int indexl = nrow * width + ncol; 
tg = (inPixels[index1] >> 8) & Oxff; 
min = Math.min (tg, min) ; 


i 
) 


} 
} 
outPixels[index] = (255 << 24) | (min << 16) | (min << 8) | min; 
} 


SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 


完整 的 基于 平坦 结构 元 素 实现 灰 度 图 像 腐 蚀 的 源 代 码 参见 源 文件 中 11-7 的 GrayErosion-Filter 类 。 非 平坦 结构 元 素 的 代码 请 读者 自己 根据 上 述 程序 改动 得 到 。 
3. 脱 胀 


灰 度 图 像 的 膨胀 操作 与 腐蚀 操作 类 似 ， 基 于 平坦 结构 元 素 实现 灰 度 图 像 膨胀 操作 的 公式 表示 如 下 : 


f @ , (A, y) = Max Al X 一 光平 一 E) | 
] (s.t)gb | 
类 似 地 ， 基 于 非 平坦 结构 元 素 实 现 灰 度 图 像 膨胀 操作 的 公式 表示 如 下 : 

fGQb.lj(x,y) = max if(x —^s,y —t) + by(s,t) | 


(s.t) Eby 


通常 情况 下 非 平坦 结构 元 素 很 少 使 用 ， 从 定义 可 以 看 出 ， 膨 胀 以 后 的 灰 度 图 像 亮 度 应 该 比 原 图 像 更 亮 ， 而 腐蚀 之 后 的 灰 度 图 像 比 原 图 像 更 瞳 。 基 于 平坦 结构 元 素 实现 灰 度 图 像 膨胀 的 代码 如 下 : 


int width = src.getWidth () ; 
int height = src.getHeight () ; 
if (dest == null) 


dest = createCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width * height]; 
int[] outPixels = new int[width * height]; 


getRGB (src, 0, 0, width, height, inPixels) ; 


int s = elements[0].length; 
int t = elements.length; 


for (int row = 0; row < height; rowt+) { 
int tg = 0; 
for (int col = 0; col < width; col++) { 
index = row * width + col; 
max = 0; 
for (int subRow-0; subRow<t; subRowt++) 
{ 


int nrow = row - subRow; 
if (nrow < 0 || nrow >= height) 


nrow = 0; 
} 
for (int subCol-0; subCol<s; subCol++) 
{ 


int ncol = col - subCol; 
if (ncol < 0 || ncol >= width) 
{ 


ncol = 0; 


int indexl = nrow * width + ncol; 
tg = (inPixels[index1] >> 8) & Oxff; 
max = Math.max (tg, max) ; 


} 


outPixels[index] = (255 << 24) | (max << 16) | (max << 8) | max; 
} 


SetRGB (dest, 0, 0, width, height, outPixels) ; 
return dest; 


完整 的 基于 平坦 结构 元 素 实现 灰 度 图 像 膨 胀 的 源 代码 参见 源 文件 中 11-7 的 GrayDilation-Filter 类 。 非 平坦 结构 元 素 的 代码 请 读者 自己 根据 上 述 程 序 改动 得 到 。 更 多 关于 灰 度 图 像 形 态 学 知识 ， 读 者 可 以 
自己 进一步 阅读 相关 文档 与 书籍 。 


11.8 “小结 


本 章 从 最 基本 的 数学 集合 概念 入 手 ， 由 浅 入 深 地 介绍 了 二 值 图 像 集合 的 各 种 基本 操作 与 代码 实现 ， 在 保证 读者 掌握 这 些 基 础 知识 之 后 ， 介 绍 了 二 值 图 像 的 腐蚀 、 膨 胀 、 开 闭 操 作 等 ， 其 中 穿插 介绍 如 何 
使 用 这 些 知 识 实 现 二 值 图 像 的 边缘 提取 ， 接 着 介绍 了 二 值 图 像 中 特定 形状 检测 的 算法 Hit-and-Miss 变 换 ， 同 时 对 图 像 距离 变换 也 做 了 详细 的 表述 与 代码 实现 ， 介 绍 了 图 像 形 态 学 中 非常 重要 的 知识 点 之 一 
分 水 岭 算法 ， 利 用 浸泡 理论 实现 了 该 算法 编码 。 最 后 本 章 还 对 基于 二 值 图 像 基本 形态 学 操作 扩展 到 灰 度 图 像 中 如 何 处 理 做 了 简单 的 介绍 ， 实 现 了 灰 度 图 像 的 腐蚀 与 膨胀 操作 。 


关于 图 像 形态 学 中 的 各 种 知识 本 章 不 可 能 面面俱到 ， 但 是 本 章 中 所 讲 内 容 都 是 具有 实际 应 用 意义 的 ， 而 且 是 图 像 形态 学 中 基础 且 重 要 的 知识 点 ， 掌 握 这 些 知识 有 助 于 读者 自己 进一步 学 习 图 像 形态 学 的 
其 他 知识 。 


本 章 还 涉及 一 些 基础 而 且 简 单 的 数学 集合 概念 ， 建 议 读者 温习 相关 的 数学 知识 ， 这 样 可 以 更 好 地 理解 本 章 所 学 。 同 时 强烈 建议 阅读 、 运 行 、 修 改 本 章 中 源 代码 ， 因 为 源 代 码 也 是 本 书 的 一 部 分 ， 只 有 不 
断 地 动手 实现 ， 对 照 理论 进行 学 习 ， 才 能 真正 做 到 学 以 致 用 。 


第 12 章 ”图 像 分 割 


本 章 将 为 读者 介绍 图 像 分 割 (Image Segmentation) 的 基本 概念 与 知识 ， 由 于 图 像 分 割 本 身 涉 及 很 多 的 数学 知识 ， 所 以 在 本 章 会 尽量 用 大 家 都 能 理解 的 语言 组 织 与 介绍 这 些 数 学 知识 。 图 像 分 割 在 对 
象 识 别 与 跟踪 、 图 像 搜索 、 图 像 编辑 、 内 容 压缩 等 方面 都 具有 十 分 重要 的 意义 。 


常见 的 图 像 分 割 是 指 根据 特定 分 类 方法 将 图 像 中 的 相同 对 象 区 别 开 来 ， 或 者 从 图 像 背 景 中 分 割 出 图 像 前 景 对 象 。 其 算法 大 致 可 以 分 为 两 类 ， 一 类 是 可 以 自动 识别 对 象 分 割 ， 整 个 处 理 过 程 不 需要 人 为 干 
预 ， 另 外 一 类 是 要 根据 输入 参数 确定 图 像 中 的 对 象 分 割 。 根 据 图 像 的 不 同 特征 又 可 以 将 图 像 分 割 法 分 为 三 类 ， 分 别 基于 图 的 知识 实现 、 基 于 数学 统计 分 析 知 识 实 现 和 基于 图 像 不 同 区域 合 并 实现 。 本 章 对 上 
述 几 种 方法 均 有 涉及 ， 读 者 也 可 以 自己 一 步 阅读 了 解 。 


12.1 RERNA 


很 多 人 对 PS 中 各 种 抠 图 实现 移花接木 的 技术 充满 兴趣 ， 其 实 只 要 学 习 好 本 章 知识 ， 你 就 会 发 现实 现 类 似 的 抠 图 应 用 真 的 不 是 想象 中 的 那么 难 。 本 质 上 市 场 上 五 花 八 门 的 抠 图 应 用 都 是 基于 一 些 常见 的 图 


像 分 割 算 法 ， 然 后 再 加 上 点 人 工 操作 就 完成 了 。 其 效果 是 否 理想 ， 除 了 图 像 本 身 的 质量 以 外 ， 其 背后 还 是 图 像 分 割 算 法 是 个 决定 性 因素 之 一 。 
1. 基 于 统计 学 知识 图 像 分 割 方法 


一 幅 图 像 通过 适合 的 辣 值 可 以 分 为 前 景 与 背景 像素 ， 一 个 极端 的 例子 是 图 像 二 值 化 ， 但 是 如 果 只 有 一 个 全 局 阅 值 ， 往 往 得 到 的 图 像 分 割 结果 并 不 理想 。 常 见 的 都 是 基于 可 变 立 值 来 实现 图 像 分 割 的 ， 基 
于 阅 值 的 图 像 分 割 方法 要 求 图 像 前 景 对 象 与 背景 对 象 分 布 融 合 度 不 高 ， 如 果 背 景 对 象 与 前 景 对 象 相互 重 敬 ， 则 该 方法 得 到 的 结果 会 很 不 理想 。 


另外 一 种 技术 是 Cluster 分 类 ， 基 于 Cluster 实 现 图 像 分 割 方 法 是 一 种 非 自我 监督 的 图 像 分 割 技术 ， 在 该 方法 中 ， 每 个 Cluster 集 合 内 部 的 像素 都 高 度 相 似 ， 每 个 没有 被 指派 到 特定 Cluster 的 像素 都 要 计算 
出 它 与 每 个 cluster 的 相似 度 ， 从 而 保证 它 被 放 入 与 之 最 相似 的 Cluster 中 ， 通 过 不 断 更 新 Cluster 中 心 像素 迭代 实现 图 像 分 割 ， 基 于 该 技术 最 常见 的 算法 有 K-Means 算 法 与 Fuzzy C-Means 算 法 。 


2. 基 于 区 域 的 图 像 分 割 方法 


基于 区 域 的 图 像 分 割 方法 ， 首 先 通 过 处 理 分 类 获得 图 像 的 每 个 区 域 ， 然 后 根据 每 个 区 域 的 相似 度 进行 合并 或 分 离 ， 最 终 得 到 图 像 分 割 的 结果 。 最 常见 的 是 基于 图 像 分 水 岭 算 法 实现 区 域 分 割 ， 然 后 根据 
区 域 之 间 的 相似 度 进行 区 域 合 并 ， 得 到 最 终 的 图 像 分 割 结果 。 本 章 将 对 此 进行 详细 介绍 ;另外 一 种 区 域 图 像 分 割 方法 是 基于 图 或 树 的 数据 结构 分 割 与 合并 实现 。 


3. 基 于 边缘 的 图 像 分 割 方法 


最 常用 的 基于 边缘 的 图 像 分 割 方法 是 基于 图 像 一 阶 或 二 阶 导 数 计 算 结果 实现 的 ， 通 常 一 阶 导 数 求 得 图 像 梯度 实现 分 割 ， 二 阶 导 数 则 通过 拉 普 拉 斯 算 子 实现 分 割 。 最 常用 的 边缘 算 子 有 Sobe| 算 子 、 
Prewitt 算 子 与 Roberts 算 子 ，Canny 边 缘 提 取 算法 基于 高 斯 模糊 实现 ， 可 以 更 好 地 获取 图 像 边 缘 。 但 是 在 实际 操作 中 ， 这 些 边缘 操作 算 子 得 到 的 图 像 边 缘 最 终 不 能 形成 闭合 区 域 ， 无 法 最 终 确 定 图 像 分 割 区 
域 ， 所 以 还 需要 通过 其 他 图 像 处 理 手段 来 完成 最 终 的 图 像 分 割 。 


另外 ， 基 于 灰 度 图 像 形态 学 操作 ， 也 常常 用 来 作为 图 像 分 割 的 手段 ， 在 某 些 情况 下 效果 还 不 错 ， 但 是 大 多 数 时 人 息 ， 需 要 进一步 合并 分 割 区 域 。 


从 上 面 的 介绍 也 可 以 看 出 ， 图 像 分 割 的 大 致 方向 就 是 运用 各 种 数学 知识 实现 对 图 像 每 个 像素 类 别 的 划分 。 除 了 上 述 介绍 的 这 些 方 法 ， 在 应 用 中 经 常用 到 的 图 像 分 割 方法 还 有 基于 高 斯 混合 模型 
(GMM) 方法 、 基 于 图 的 最 小 割 的 方法 等 。 


图 像 分 割 (Image Segmentation) 在 对 象 跟踪 、 物 体 识 别 、 匹 配 中 是 常见 且 非 常 重 要 的 处 理 算法 ， 纯 粹 的 抠 图 通常 还 有 另外 一 个 名 称 ， 即 GrabCut。 这 里 只 是 介绍 概念 ， 不 做 进一步 的 深入 探讨 ， 后 
面 将 对 本 节 提 及 到 各 种 图 像 分 割 方 法 给 出 具体 的 算法 细节 与 编码 实现 ， 帮 助 读者 真正 做 到 理论 与 实践 相 结合 。 


12.2 ”基于 Mean-Shift 的 图 像 分 割 


Mean-Shift 算 法 最 早 是 在 1975 年 由 Fukunaga 和 Hostetler 两 位 提出 并 实现 的 。 起 初 并 没有 引起 足够 重视 ， 直 到 2000 年 左右 有 人 将 Mean-Shift 算 法 用 来 实现 视频 中 的 标记 对 象 跟踪 ，Mean-Shift 算 法 
的 威力 才 得 到 了 最 大 限度 的 释放 。 本 节 在 通过 Mean-Shift 算 法 实现 图 像 自动 分 割 时 ， 不 需要 输入 Cluster 的 数目 ， 这 与 稍 后 介绍 的 K-Means 算 法 略 有 不 同 ， 决 定 Mean-Shift 算 法 分 类 Cluster 数 目的 有 两 个 参 
数 ， 分 别 为 空间 距离 (Radius) 与 颜色 值 的 范围 (Color Distance) ， 假 设 空间 距离 (Radius) 为 3， 表 示 像 素 距离 在 3 个 像素 以 内 ， 颜 色 值 范围 (Color Distance) 为 25， 表 示 颜 色差 值 在 25 以 内 。 


1. 算 法 解释 


本 质 上 Mean-Shift 算 法 是 一 种 根据 分 布 密度 来 决定 分 类 的 算法 ,假设 有 图 12-1 所 示 的 左边 的 像素 点 分 布 。 


y| «shes ^ Y 


图 12-1 像素 点 分 布 


根据 图 12-1 中 的 分 布 密 度 ，Mean-Shift 算 法 发 现 有 两 个 最 大 密度 分 布 ， 如 图 12-1 右 侧 所 示 。Mean-Shift Cluster 算 法 假设 在 d 维 空间 R94 上 有 n 个 数据 点 x;， 其 中 i 取 值 范围 为 1~n， 其 多 元 核 密度 估算 公 
式 表示 为 : 


Hn 


其 中 K (x) 表示 核 ，h 为 窗口 半径 大 小 。 对 于 径 向 对 称 核 函数 ， 定 义 其 核 K (x) 满足 


(x Ck qp + 


其 中 ck,，d 是 归 一 化 常量 ,保证 K (x) 整合 为 |。 最 终 密 度 模型 在 梯度 变化 vf (x) = 0 处 停止 。Mean-shift 算 法 就 是 通过 不 断根 据 计 算出 来 的 梯度 差 值 来 实现 窗口 移动 的 ， 而 且 窗口 移动 的 最 终 方向 为 概 


[ 


率 密 度 最 大 点 处 。 关 于 Mean-Shift 算 法 的 收敛 性 证 明 读 者 可 以 查阅 相关 资料 ， 这 里 不 再 介绍 。 


对 于 空间 分 布 的 点 ，Mean-Shift 可 以 根据 密度 分 布 实现 分 类 ， 对 于 图 像 像素 来 说 ， 每 个 像素 点 的 位 置 是 均匀 分 布 的 ， 但 是 别 志 记 每 个 像素 值 都 不 是 均匀 分 布 的 ， 所 以 在 像素 值 空间 与 像素 坐标 空间 结合 
之 后 的 5 维 空间 中 (x, y, r, g, b) 中 ， 空 间距 离 越 近 ，RGB 值 越 相似 的 像素 点 则 越 容易 被 归属 到 同一 个 密度 分 布 中 ， 所 以 针对 这 5 维 空间 中 的 每 个 像素 点 ， 运 用 Mean-shift 直 到 收敛 ， 就 会 得 到 几 个 本 地 


最 大 的 密度 分 布点 ， 而 在 Mean-Shift 算 法 计算 这 些 最 大 密度 分 布点 的 过 程 中 ，vf (x) 0 时 位 移 走 过 那 些 像 素 ， 很 自然 被 分 到 不 同 本 地 密度 最 大 点 的 集合 中 ， 待 所 有 像素 都 被 分 类 以 后 ， 也 就 完成 了 图 像 的 
Mean-Shift 分 割 。 当 然 这 只 是 理论 上 的 ， 实 际 编码 中 还 要 考虑 根据 输入 阅 值 把 最 小 分 类 合并 。 所 以 ， 这 里 基于 Mean-Shift 算 法 实现 的 图 像 分 割 步骤 如 下 : 


1) 读 取 像 素数 组 ， 将 像素 值 从 RGB 空间 转换 到 YIQ 空 间 。 

2) 开始 Mean-Shift 算 法 。 

a) 随机 初始 化 Mean-shift 算 法 开始 点 (这 样 做 好 处 是 可 以 减少 计算 量 ) 。 

b) 对 每 个 随机 Mean-shift 开 始点 开始 Mean-shift 操 作 ， 直 到 收敛 。 

c) 对 没有 被 Mean-Shift 的 像素 点 ， 根 据 像素 值 分 派 到 相似 的 Cluster 中 。 

d) 根据 Mean-Shift Cluster 中 心 像素 值 更 新 Cluster 中 的 每 个 像素 值 。 

e) 循环 a~d 直 到 符合 条 件 退 出 。 

3) 合并 小 于 靖 值 数目 的 分 类 。 

A) 将 像素 值 重新 转换 到 RGB， 以 Mean-Shift 分 类 计算 得 到 的 值 作 为 分 类 以 后 各 个 像素 点 值 。 
5) 输出 显示 图 像 。 


Qum 距离 计算 采用 的 公式 是 基于 欧 几 里 得 距离 ， 在 第 二 步 的 终止 条 件 中 ， 为 了 避免 产生 过 多 计算 与 无 限 循环 ， 人 为 设置 终止 条 件 是 重复 计算 60 次 ， 当 然 可 以 根据 实际 情况 灵活 调整 。 此 外 输入 参数 
对 Mean-Shift 图 像 的 Segmentation 结 果 也 有 很 大 影响 ， 具 体 来 说 ， 若 参数 过 大 ， 会 导致 图 像 被 过 度 平 滑 ， 可 能 只 会 有 一 个 分 类 ; 若 参 数 过 小 ， 则 可 能 导致 图 像 过 度 Segmentation， 即 图 像 分 割 过 多 。 


2. 实 现 


主要 的 Mean-Shift 算 法 实现 可 以 看 成 两 大 部 分 ， 第 一 部 分 是 Mean-Shift 算 法 运用 Cluster 实 现 寻找 ,第 二 部 分 是 其 后 的 处 理 ， 主 要 是 实现 Cluster 的 合并 与 结果 显示 ， 这 里 不 再 给 出 具体 代码 片段 ， 可 以 
直接 参见 源 文 件 中 的 12-2。 


首先 ， 预 处 理 中 图 像 像素 值 从 RGB 空间 到 YIQ 空 间 转 换 的 实现 代码 如 下 : 


// convert RGB color space to YIQ color space 
float[][] pixelsf = new float[width*height][4]; 
for (int i-0; i<inPixels.length; i++) { 

int argb = inPixels[i]; 

int r = (argb >> 16) & Oxff; 


intg = (argb >> 8) & Oxff; 
int b= (argb) & Oxff; 
pixelsf[i][0] = 0.299f *r + 0.587f *g + 0.114 “Oe qu x 
pixelsf[i][1] = 0.5957£ *r - 0.2744f*g - 0.3212f *b; // 
pixelsf[i][2] = 0.2114f *r - 0.5226f*g + 0.3 žo fi © 
pixelsf[i][3] = 0.0f; // flag 
} 
随机 初始 化 Mean-Shift 开 始点 的 实现 代码 如 下 : 
// initialize the centers 
for (int i-0; i«numOfCenters; i++) 
1 
int px = random.nextInt (width) ; 
int py = random.nextInt (height) ; 
int pIndex = py * width + px; 
meanpoints[i] = new MeanPoint (py, px, new float[]{pixelsf[pIndex][0], pixelsf[pIndex][1], pixelsf[pIndex][2])]) ; 


每 个 中 心 点 实现 Mean-shift 计 算 ， 找 出 最 大 密度 分 布点 的 实现 代码 如 下 : 


private void meanShfit (MeanPoint meanPoint, Map<MeanPoint, List<PixelPoint>> result2, int width, int height, float[][] pixelsf) { 
double shift = 0.0; 


// space distance and color distance 


oat radi 


us2 radius * radius; 


loa 


t dis2 


colorDistance * colorDistance; 


// C 
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t.getl 


meanPoint. 
meanPoint.ge 
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Point» results - new ArrayList«PixelPoint» () ; 
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loa 


for 
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int num=0; 
// calculate the sum based on generated pixel 


(int ry--radius; ry <= radius; ry++) { 

int y2 = yc + ry; 

if (y2 >= 0 && y2 < height) 

for (int rx--radius; 

int x2 = xc + rx; 
if (x2 >= 0 && x2 « width) { 

j (ry*ry + rx*rx <= radius2) 
yiq = pixelsf[y2*width + x2 
Float Y2 = yiq[0]; 

loat I yiq[1]; 

loa 


yiq[2]; 
loa 
loa 


5 
loa 
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PixelPoint f = new Pix 
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elPoint (y2, x2) ; 


RGB (yiq) ; 
ts.add (f) ; 
[3] 
t= x2; 


} 


// calculate means 


Yc 


float num 
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f£/num; 


// 得 到 平均 什 


mY*num ; 


Cc 


mI*num ; 


Qc 
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yc 
if 


int 


calculate of 
t dx = xc-xcO] 
t dy = yc-ycO] 


moOxnum ; 
(int)  (mx*num 40.5) ; 
(int) (my*num 40.5) ; 
Fset 
ld; 
[ds 


t dY = Yc-YcO] 
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td 
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d 
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t dO = Qc-QcOl 
/ / shif 
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// upda 
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} 
while (sh 
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Rgb () [0] = Yc; 
Rgb () [1] = Ic; 
Rgb () [2] Qc; 
tCol (xc) ; 

Row (yc) ; 


+dQ*dQ; 
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// start 


to merge 


the find the local maximum 


Features, 


boolean 


Flag = 


false; 


for (Mean 
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Point mpKey : 


result2.keySet () ) 


t del 


ltaY = meanPoint.ge - mpKey.getRow () ; 


t del 


taX = meanPoint.ge - mpKey.getCol () ; 


oa 


deltaYc = mpKey.getl [0] - meanPoint 


loa 


deltalc = mpKey.ge 


loa 


— meanPoint 


deltaQc = mpKey.getl [2] 


loa 


twoSpaceDis = deltaY * deltaY + deltaX * delta 


loa 
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f (twoSpace 


+ deltaIc * de 
Dis <= dis2) 


twoColorDis = deltaYc * deltaYc 
Dis <= radius2 && twoColor 


List<PixelPoint> pList = result2.get (mpKey) ; 


MergeTwo (pList, results) ; 
flag = true; 
break; 
} 
/ new density center 
f (! flag) 
result2.put (meanPoint, results) ; 


合并 Cluster 与 更 新 像素 值 的 代码 如 下 : 


// now assign remaining pixels to 


feature space 


for (int row=0; 


pu. 


for (int col=0; 
index 
f (pixelsf [index] [3] == 0.0f) 


row<height; row++) { 
col<width; col++) 
row * width + col 


{ 


ace? | 


{ 


} 


else 


{ 


} 


} 
// update with 
for (MeanPoint 


{ 


MeanPoint smp = findSimilarMeans (pixelsf [index 
PixelPoint £ = new PixelPoint (row, col) ; 

f.setRGB (new float[] {pixelsf [index] [0], pixelst 
allPoints.get (smp) .add (£) 
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rh 


[index] [3] .0f; // reset 


pixelsí 


means centers 
mpKey : allPoints.keySet () ) 


Point ft : 


for (Pixel 
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allPoints.get (mpKey) ) 


t.getRgb 
[1] - meanPoint.getRgb 
t.getRgb 


100; // flag it 
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() 
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X; 
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], 


f [index] [1], pixels! 


t deltaQc * deltaQc; 


allPoints.keySet () ) ; 


f [index] [21]) ; 


index = ft.getRow () * width + ft.getCol () ; 
pixelsf[index][0] = mpKey.getRgb () [0]; 
pixelsf[index][1] = mpKey.getRgb () [1]; 
pixelsf[index][2] = mpKey.getRgb () [2]; 


完整 的 基于 Mean-Shift 算 法 实现 图 像 分 割 的 源 代码 参见 源 文件 中 12-2 的 MeanShiftAlgo.java， 其 中 用 到 的 两 个 数据 结构 类 PixelPoint.java 与 MeanPointjava 只 是 用 来 存储 像素 点 位 置信 息 与 像素 值 
读者 可 以 进一步 优化 代码 实现 ， 完 成 自己 版 本 的 Mean-Shift 图 像 分 割 算法 。 


S 


另外 常见 的 Mean Shift 图 像 分 割 多 是 基于 LUV 色 彩 空间 的 ， 读 者 也 可 以 在 理解 本 节 内 容 的 基础 上 进一步 改写 程序 ， 完 成 基于 LUV 色 彩 空间 的 Mean-shift 图 像 分 割 代码 。 


12.3 ”基于 K-Means 的 图 像 分 割 


K-Means 算 法 的 起 源 可 以 追溯 到 1957 年 ，K-Means 一 词 首次 由 MacQueen 提 出 ，K-Means 算 法 作为 一 种 聚 类 算法 ， 因 为 其 简单 高 效 ， 在 静态 数据 挖掘 分 析 、 图 像 分 割 等 领域 得 到 了 广泛 应 用 。K- 
Means 算 法 要 求 预 先知 道 数据 被 分 为 多 少 个 Clusters， 这 个 与 Mean-Shift 有 所 不 同 。 


1. 算 法 解释 

K-Means 算 法 是 将 集合 数据 D 分 成 为 k 个 不 同 的 Cluster (分 类 ) ， 每 个 Cluster 都 有 自己 的 质心 点 。K-Means 算 法 的 具体 步骤 如 下 : 
1) 假设 数据 集合 D 中 包含 n 个 数据 点 (D1…Dn) . 

2) 根据 输入 的 Cluster 数 目 K， 随 机 初始 化 K 个 中 心 点 。 

3) 对 数据 集 D 中 的 每 个 数据 点 ， 计 算 它 到 每 个 Cluster 中 心 的 距离 ， 与 哪个 Cluster 中 心 距 离 最 小 ， 则 该 点 属于 哪个 Cluster。 

4) 对 每 个 Cluster 中 所 有 数据 点 计算 平均 值 ， 作 为 新 的 Cluster 中 心 点 ， 计 算 新 中 心 与 原来 中 心 点 差 值 。 

5) 重复 第 3~4 步 直到 收敛 (直到 差 值 变化 很 小 或 不 变 ) 。 


第 三 步 中 的 距离 计算 ， 最 常见 是 使 用 欧 几 里 得 距离 ， 此 外 还 可 以 使 用 曼哈顿 距离 或 象棋 格 距离 。 介 绍 了 K-Means 算 法 之 后 ， 下 面 就 是 如 何 将 K-Means 算 法 运用 到 图 像 分 割 中 。 一 幅 图 像 本 质 上 是 由 有 限 
个 数 的 像素 点 组 成 的 ， 每 个 像素 点 都 有 RGB 值 。 假 设 全 部 的 像素 数据 点 有 K 个 Cluster， 计 算 每 个 像素 点 到 每 个 Cluster 中 心 点 的 RGB 空间 距离 ， 与 其 中 一 个 Cluster 中 心 点 距离 最 近 的 像素 点 则 属于 该 
cluster， 对 全 部 的 像素 点 执行 同样 的 操作 ， 直 到 收敛 就 完成 了 基于 K-Means 的 图 像 分 割 。 


2. 代 码 实现 
K-Means 图 像 分 割 的 代码 实现 大 致 可 以 分 为 如 下 几 步 : 


1) 根据 输入 参数 (Cluster 数目 ) ， 随 机 初始 化 K-Means 中 心 点 。 代 码 实现 如 下 : 


//Create random points to use a the cluster center 
Random random = new Random () ; 
for (int i = 0; i < numOfCluster; i++) 


{ 


int randomNumberl = random.nextInt (width) ; 

int randomNumber2 = random.nextInt (height) ; 

index = randomNumber2 * width + randomNumber1; 

ClusterCenter cp = new ClusterCenter (randomNumberl,  randomNumber2) ; 
int argb = inPixels[i]; 

int r = (argb >> 16) & Oxff; 
(argo >> 8) & Oxff; 
(argo) & Oxff; 
cp.setRGB (new int[]{r, g, b}) ; 
cp.setIndex (i) ; 
clusterCenterList.add (cp) ; 


pi 


Q 
lo dmn og 


) 


2) 对 所 有 像素 点 初始 化 ， 完 成 最 初 的 像素 K-Means 分 类 。 代 码 实现 如 下 : 


// create all cluster point 
for (int row = 0; row < height; ++row) 


{ 


for (int col = 0; col < width; ++col) 


{ 


index = row * width + col; 
int color = inPixels [index]; 


PixelPoint pp = new PixelPoint (row, col) ; 
intr = (color >> 16) & Oxff; 

int g = (color >> 8) & Oxff; 

int b= (color) & Oxff; 


pp.setRGB (new float []{r, g, b)) ; 
pp.setLable (-1) ; 
pointList.add (pp) ; 


} 


// initialize the clusters for each point 
double[] clusterDisValues = new double[clusterCenterList.size () ]; 


for (int i20; i<pointList.size () ; i++) 
{ 
for (int j=0; j«clusterCenterList.size () ; j++) 
{ 
clusterDisValues[j] = calculateEuclideanDistance (clusterCenterList.get (j) , pointList.get (i) ) ; 


} 
pointList.get (i) .setLable (getCloserCluster (clusterDisValues) ) ; 


其 中 计算 像素 点 与 Cluster 中 心 点 距离 的 代码 如 下 : 


private double calculateEuclideanDistance (ClusterCenter p, PixelPoint c) 
// each pixel 
int pr = (int) p.getRGB () [0]; 
int pg = (int) p.getRGB () [1]; 
int pb = (int) p.getRGB () [2]; 
// cluster center 
int cr = (int) c.getRGB () [0]; 
int cg = (int) c.getRGB () [1]; 
int cb = (int) c.getRGB () [2]; 
return Math.sqrt (Math.pow ( (pr - cr) , 2.0) + Math.pow ( (pg - cg) , 2.0) + Math.pow ( (pb - cb), 2.0) ) ; 


3) 计算 分 类 以 后 每 个 Cluster 的 像素 点 平均 值 ， 并 用 此 更 新 中 心 点 像素 值 。 代 码 实现 如 下 : 


private double[] reCalculateClusterCenters () { 
// clear the points now 
for (int i20; i<clusterCenterList.size () ; i++) 


a 


clusterCenterList.get (i) .setNumOfPixels (0) ; 


// recalculate the sum and total of points for each cluster 


double redSums = new double[3]; 
double[] greenSum = new double[3]; 
double[] blueSum = new double[3]; 
for (int i=0; i<pointList.size () ; i++) 
{ 
int cIndex = (int) pointList.get (i) .getLable () ; 
clusterCenterList.get (cIndex) .addNumOfPixel () ; 
int tr = (int) pointList.get (i) .getRGB () [0]; 
int tg = (int) pointList.get (i) .getRGB () [1]; 
int tb = (int) pointList.get (i) .getRGB () [2]; 
redSums [cIndex] += tr; 
greenSum[cIndex] += tg; 
blueSum[cIndex] += tb; 
} 
double[] oldClusterCentersColors = new double[clusterCenterList.size () ]; 
for (int i=0; i<clusterCenterList.size () ; i++) 
{ 
double sum = clusterCenterList.get (i) .getNumOfPixels () ; 
int cIndex = clusterCenterList.get (i) .getIndex () ; 
int red = (int) (greenSum[cIndex]/sum) ; 
int green = (int) (greenSum[cIndex]/sum) ; 
int blue = (int) (blueSum[cIndex]/sum) ; 
System.out.println ("red = "+ red + " green = " + green + " blue = " + blue) ; 
int clusterColor = (255 << 24) | (red << 16) | (green << 8) | blue; 
clusterCenterList.get (i) .setRGB (new int[]{red, green, blue}) ; 
oldClusterCentersColors[i] = clusterColor; 


return oldClusterCentersColors; 


4) 比较 两 次 得 到 的 Cluster 中 心 点 像素 平均 值 是 否 相等 ， 相 等 则 停止 ， 否 则 继续 步骤 3。 代 码 实 现 如 下 : 


while (true) 


{ 


stepClusters () ; 
double[] newClusterCenterColors - reCalculateClusterCenters () ; 
if (isStop (oldClusterCenterColors, newClusterCenterColors) ) 
{ 
break; 
} 
else 


{ 
} 


oldClusterCenterColors = newClusterCenterColors; 


其 中 ，stepClusters 方 法 实现 的 代码 如 下 : 


private void stepClusters () 


{ 


// initialize the clusters for each point 
double[] clusterDisValues = new double[clusterCenterList.size () ]; 


for (int i=0; i<pointList.size () ; i++) 
{ 
for (int j=0; j«clusterCenterList.size () ; j++) 
{ 
clusterDisValues[j] = calculateEuclideanDistance (clusterCenterList.get (j) ,  pointList.get (i) ) ; 


} 
pointList.get (i) .setLable (getCloserCluster (clusterDisValues) ) ; 


5) 根据 得 到 的 Cluster 分 类 ， 对 每 个 像素 点 赋值 ， 输 出 结果 。 代 码 实现 如 下 : 


//update the result image 
dest = createCompatibleDestImage (src, null ) ; 


index = 0; 
int[] outPixels = new int[width*height]; 
for (int j = 0; j < pointList.size () ; j++) 
{ 
for (int i = 0; i < clusterCenterList.size () ; i++) 


{ 
PixelPoint p = this.pointList.get (j) ; 


if (clusterCenterList.get (i) .getIndex () == p.getLable () ) 
{ 

int row = p.getRow () ; // row 

int col = p.getCol () ; // column 


index = row * width + col; 
int[] rgb = clusterCenterList.get (i) .getRGB () ; 
outPixels [index] = (Oxff << 24) | (rgb[0] << 16) | (rgb[1] << 8) | rgb[2]; 


完整 的 基于 K-Means 图 像 分 割 算 法 的 源 代码 参见 源 文 件 中 12-3 的 KMeansAlgo.java， 其 中 用 到 的 两 个 数据 结构 类 ClusterCenter 和 PixelPoint 同 样 可 以 在 源 文 件 中 相关 部 分 找到 。 关 于 K-Means 实 现 图 
像 分 割 的 基本 原理 与 实现 到 这 里 就 介绍 完了 ， 代 码 实 现 从 易于 读者 理解 的 角度 出 友 ， 没 有 过 多 性 能 上 的 考量 ， 感 兴趣 的 读者 可 以 进一步 优化 代码 实现 。 


12.4 基于 Fuzzy C-Means 的 图 像 分 割 


Fuzzy C-Means 算 法 是 一 种 常见 的 数据 聚合 算法 ， 可 对 数据 完成 两 个 或 两 个 以 上 的 Cluster 分 割 ， 最 常见 的 应 用 领域 是 在 数据 分 析 与 挖掘 方面 。 该 算法 由 Dunn 在 1973 年 提出 ， 在 1981 被 Bezdek 改 进 以 
后 经 常用 在 模式 识别 领域 中 。 与 K-Means 算 法 类 似 ， 该 算法 也 需要 预先 输入 Cluster 的 数目 。 


1. 算 法 解释 


Fuzzy C-means 算 法 主要 用 于 比较 RGB 空间 的 每 个 像素 值 与 Cluster 中 的 每 个 中 心 点 值 ， 最 终 给 每 个 像素 指派 一 个 值 (0~ 1 之 间 ) ， 说 明 该 像素 更 接近 于 哪里 的 中 心 点 ， 对 任意 一 个 像素 点 ， 其 对 所 有 
cluster 中 心 点 的 可 能 性 之 和 为 1。 简 单 的 举例 : 假设 图 像 中 有 三 个 聚 类 Cluster1、Cluster2、Cluster3， 像 素 A 对 应 的 三 个 聚 类 的 值 分 别 为 a1、a2、a3， 根 据 模糊 规则 可 知 ，a1+a2+a3 = 1。 更 进一步 ， 如 
果 a1 最 大 ， 则 该 像素 比较 接近 于 Cluster1。 计 算 总 的 对 象 值 J 的 公式 如 下 : 


P 
im. 
=i 
E 


2. us || x; — cj | 其 中 1 过 站 < cc 


当 J 的 前 后 两 次 差 值 小 于 指定 精度 或 不 变 时 ， 停 止 继续 分 割 ， 输 出 分 割 以 后 的 图 像 。 其 中 * ~“ | 是 指 第 ;个 像素 与 第 个 Cluster 中 心 之 间 的 欧 几 里 得 距离 ，“ 是 指 第 i 个 像素 与 第 个 Cluster 之 间 的 模糊 值 ，m 是 
输入 参数 。 计 算 模糊 值 “的 公式 为 : 


TH 


其 中 ck 的 计算 公式 为 : 


当 Jm 值 趋向 于 很 小 ， 而 且 两 次 差 值 小 于 输入 参数 (0< s < 1) 时 ， 循 环 收敛， 得 到 最 终 输 出 结果 。 根 据 上 述 基 本 原理 ， 基 于 Fuzzy C-Means 实 现 数据 Cluster 分 割 的 步骤 如 下 : 


1) 随机 初始 化 每 个 Cluster 的 中 心 值 。 


2) 初 


始 化 每 个 数据 点 到 每 个 Cluster 中 心 值 的 距离 ， 计 算 membership 值 。 


3) 计算 每 个 像素 点 与 每 个 Cluster 中 心 的 Fuzzy 值 ， 完 成 Fuzzy C-Means 的 一 个 循环 。 


4) 比较 前 后 两 次 此 的 差 值 ， 如 果 小 于 输入 的 精度 值 ， 则 退出 循环 ， 输 出 结果 ， 人 否则 继续 。 


2. 代 码 实现 


本 质 上 讲 ， 图 像 可 以 看 成 是 由 有 限 多 个 的 像素 组 成 的 ， 因 为 每 个 像素 又 都 有 颜色 值 ， 因 此 又 可 以 将 图 像 可 以 看 成 是 数据 集合 ， 这 样 就 适用 Fuzzy C-Means 算 法 了 ， 


Means 的 图 像 分 割 算法 。 编 程 实现 的 步骤 大 致 如 下 : 


1) 初始 化 所 有 像素 点 值 与 随机 选取 每 个 Cluster 的 中 心 点 ， 初 始 化 每 个 像素 点 PI 对 应 Cluster 的 模糊 值 pll[k] 并 计算 cluster index, 


2) 计算 总 的 对 象 值 J。 


3) 计算 每 个 Cluster 的 颜色 值 ， 产 生 新 的 Cluster 中 心 像素 值 。 


4) 计算 每 个 像素 对 应 每 个 Cluster 的 模糊 值 (membership) ， 更 新 每 个 像素 的 Cluster Index, 


5) 再 次 计算 对 象 值 }， 并 与 第 二 步 的 对 象 值 相 减 ， 如 果 差 值 小 于 指定 的 精度 值 或 达到 最 大 循环 数 ， 停 止 计算 输出 结果 图 像 ， 否 则 继续 第 2~4 步 。 


要 让 该 算法 正确 运行 ， 还 需要 用 户 输入 如 下 三 个 参数 。 


: numOfCluster: WITA H o 


: maxIteration: Fuzzy C Means 算 法 最 大 迭代 数目 。 


‘accuracy: 循环 停止 条 件 ， 即 精度 值 。 


初始 化 每 个 像素 点 与 随机 初始 化 cluster 中 心 点 的 代码 如 下 : 


// initialization the pixel data 
points = new ArrayList<PixelPoint> () ; 


{ 


for (int row = 0; row < src.getHeight () ; ++row) 


for (int col = 0; col < src.getWidth () ; ++col) 


{ 


index = row * width + col; 
int color = inPixels [index]; 


PixelPoint pp = new PixelPoint (row, col) ; 
intr = (color >> 16) & Oxff; 

intg = (color >> 8) & Oxff; 

int b = (color) & Oxff; 


pp.setRGB (new float[lír, g, b}) ; 
points.add (pp) ; 


} 


//Create random points to use a the cluster centroids 
Random random = new Random () ; 
clusters = new ArrayList<FCClusterCenter> () ; 


{ 


int n 
int randomNumber2 = random.nextInt (height) ; 
index = randomNumber2 * width + r 

FCClusterCenter fccc = new FCClu 
fccc.setOriginalPvalue (inPixels 
fccc.setPvalue (inPixels [index] ) 


for (int i= 0; i < numOfCluster; i++) 


t (width) ; 


t ct 


randomNumberl = random.nextI 


andomNumber1; 


index]) ; 


clusters.add (fccc) ; 


初始 化 计算 每 个 像素 点 对 应 每 个 cluster 中 心 点 距离 的 代码 如 下 : 


sterCenter (randomNumber2,  randomNumberl) ; 
[ 


// Iterate through all points to create initial U matrix 

double diff; 

fuzzyForPixels = new double[this.points.size () ][this.clusters.size () ]; 
for (inti = 0; i < this.points.size () ; i++) 


{ 


PixelPoint p = points.get (i) ; 


for (int j = 0; j < this.clusters.size () ; j++) 


FCClusterCenter c - this.clusters.get (j) ; 


fuzzyForPixels[i][j] = (diff — 0) ? Eps: diff; 


diff = Math.sqrt (Math.pow (calculateEuclideanDistance (p, c), 2.0) ) ; 


自然 也 就 有 了 实现 基于 Fuzzy C- 


其 中 calculateEuclideanDistance () 方法 用 于 计算 两 个 像素 点 之 间 的 欧 几 里 得 距离 。 实 现 每 个 像素 点 到 每 个 cluster 中 心 membership 的 可 能 性 系数 计算 的 代码 如 下 : 


privat 


te void recalculateClusterMembershipValues () 


for (int i= 0; i < this.points.size () ; i++) 


double max = 0.0; 

double min = 0.0; 

double sum = 0.0; 

double newmax = 0; 

PixelPoint p = this.points.get (i) ; 

//Normalize the entries 

for (int j = 0; j < this.clusters.size () ; j++) 


{ 


P 


max = fuzzyForPixels[i][j] > max ? 
min = fuzzyForPixels[i][j] < min ? 


E 


//Sets the values to the normalized values between 0 and 1 
for (int j = 0; j < this.clusters.size () ; j++) 


{ 


fuzzyForPixels[i][j] = (fuzzyForPixels[i][j] - min) / 
sum += fuzzyForPixels[i][jl; 


//Makes it so that the sum of all values is 1 


for (int j = 0; j < this.clusters.size () ; j++) 

{ 
fuzzyForPixels[i][j] = fuzzyForPixels[i] [j] / sum; 
if (Double.isNaN (fuzzyForPixels[i][j]) ) 
{ 


fuzzyForPixels[i] [j] = 0.0; 


uzzyForPixels[i][j] : 
uzzyForPixels[i][j] : 


(max - min) ; 


newmax = fuzzyForPixels[i][j] > newmax ? fuzzyForPixels[i][j] : newmax; 


// ClusterIndex is used to store the strongest membership value to a cluster, used for defuzzification 
p.setPossible (newmax) ; 


实现 Fuzzy C-MeansiE(Sir ARBAT : 


int k = 0; 

double oldJm = calculateObjectiveFunction () ; 

do 

{ 
k++; 
calculateClusterCentroids () ; 
stepFuzzy () ; 
double Jnew = calculateObjectiveFunction () ; 
System.out.println ("Run method accuracy of delta value = " + Math.abs (oldJm - Jnew) ) ; 
if (Math.abs (oldJm - Jnew) < accuracy) break; 
oldJm = Jnew; 


while (maxIteration > k) ; 


其 中 ，stepFuzzy () 的 实现 代码 如 下 : 


public void stepFuzzy () 
{ 


for (int c = 0; c < this.clusters.size () ; c++) 


{ 


for (int h = 0; h < this.points.size () ; h++) 
{ 

double top; 

top = calculateEuclideanDistance (this.points.get (h) , this.clusters.get (c) ) ; 
if (top < 1.0) top = Eps; 
// sumTerms is the sum of distances from this data point to all clusters. 
double sumTerms - 0.0; 
for (int ck = 0; ck < this.clusters.size () ; ck++) 


{ 
} 


// Then the membership value can be calculated ashttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/OEBPS/Text/... 
fuzzyForPixels[h][c] = (double) (1.0 / Math.pow (sumTerms, (2/ (this.fuzzy = 1) ) ) ) 5; 


sumTerms += top / calculateEuclideanDistance (this.points.get (h) , this.clusters.get (ck) ) ; 


I 


} 
i 


this.recalculateClusterMembershipValues () ; 


计算 总 对 象 值 ) 的 代码 实现 如 下 : 


public double calculateObjectiveFunction () 


{ 


double Jk = 0.0; 
for (int i= 0; i < this.points.size () ; i++) 
{ 
for (int j = 0; j < this.clusters.size () ; j++) 


{ 


Jk += Math.pow (fuzzyForPixels[i][j], this.fuzzy) * Math.pow (this.calculateEuclideanDistance (points.get (i) , clusters.get (j) ) , 2); 
} 


return Jk; 


更 新 每 个 Cluster 中 心 像素 平均 值 的 代码 如 下 : 


public void calculateClusterCentroids () 


{ 


for (int j = 0; j < this.clusters.size () ; j++) 


{ 


FCClusterCenter clusterCentroid = this.clusters.get (j) ; 
double 1 = 0.0; 
clusterCentroid.setRedSum (0) ; 
clusterCentroid.setBlueSum (0) ; 
clusterCentroid.setGreenSum (0) ; 
clusterCentroid.setMemberShipSum (0) ; 

double redSum = 0; 

double greenSum = 0; 

double blueSum = 0; 

double memebershipSum = 0; 

// double pixelCount = 1; 

for (int i = 0; i < this.points.size () ; i++) 


{ 


t ct 


PixelPoint p = this.points.get (i) ; 

1 = Math.pow (fuzzyForPixels[i][j], this.fuzzy) ; 
int tr = (int) p.getRGB () [0]; 
int tg = (int) p.getRGB () [1]; 
int tb = (int) p.getRGB () [2]; 
redSum += 1 * tr; 

greenSum += 1 * tg; 

blueSum += 1 * tb; 
memebershipSum += 1; 


} 


int clusterColor = (255 «« 24) ( (int) (redSum / memebershipSum) «« 16) | ( (int) (greenSum / memebershipSum) «« 8) | (int) (blueSum / memebershipSum) ; 
clusterCentroid.setPvalue (clusterColor) ; 


根据 计算 返回 值 ， 显 示 最 终 分 割 以 后 图 像 的 代码 如 下 : 


//update the original image 


dest = createCompatibleDestImage (src, null ) ; 
index = 0; 
int[] outPixels = new int[width*height]; 
for (int j = 0; j < this.points.size () ; j++) 
{ 
for (int i = 0; i < this.clusters.size () ; i++) 


PixelPoint p = this.points.get (j) ; 
if (fuzzyForPixels[j][i] == p.getPossible () ) 
{ 


int row = (int) p.getRow () ; // row 

int col = (int) p.getCol () ; // column 

index = row * width + col; 

outPixels [index] = this.clusters.get (i) .getPvalue () ; 


} 


// fill the pixel data 
SetRGB ( dest, 0, 0, width, height, outPixels ) ; 
return dest; 


从 上 面 的 代码 也 可 以 看 出 ， 最 终 每 个 像素 被 分 配 到 与 之 最 相似 的 Cluster 中 ，K-Means 则 每 次 都 会 不 断 地 对 每 个 像素 进行 分 割 ， 而 Fuzzy C-Means^ Write ( CE Sa ae 
K-Means 实 现 的 图 像 分 割 叫做 硬 分 割 ， 而 把 基于 Fuzzy C-Means 或 类 似 算法 的 图 像 分 割 叫做 软 分 割 。 


， 最 后 分 割 。 所 以 有 人 把 基于 


完整 的 Fuzzy C-Means 图 像 分 割 源 代码 可 以 参见 源 文件 中 12-4 的 FuzzyCMeansAlgo.java， 其 相关 数据 结构 类 FCClusterCenter.java 同 样 可 以 在 那里 得 到 。 读 者 可 以 尝试 运作 与 修改 源 代码 ， 让 其 更 加 


有 效率 地 执行 。 


12.5 ”基于 分 水 岭 的 图 像 分 割 
图 像 形态 学 是 

将 彩色 图 像 变 为 灰 度 级 别 的 梯度 图 像 ， 然 后 使 用 分 水 岭 变 换 实现 图 像 分 割 ， 这 个 直接 输出 的 结果 往往 被 过 度 分 割 ， 所 以 还 需要 后 续 处 理 ， 通 过 直方 图 相似 度 实现 合并 ， 才 能 得 
1. 基 本 思路 
常见 的 彩色 图 像 分 水 岭 分 割 方法 是 将 图 像 转换 为 灰 度 图 像 ， 然 后 进行 分 割 处 理 ， 最 常见 的 处 理 有 如 下 几 种 方式 : 
OX 


于 距离 变化 实现 灰 度 级 别 调整 ， 为 分 水 岭 变 换 分 割 做 好 准备 。 


. 基于 梯度 计算 实现 灰 度 级 别 调整 ， 为 分 水 岭 变换 分 割 做 好 准备 。 
. 基于 标记 控制 的 分 水 岭 变 换 ， 要 实现 自动 标记 寻找 。 


上 述 三 种 途径 均 可 以 实现 图 像 分 水 岭 分 割 ， 基 于 距离 变换 或 梯度 的 方法 容易 导致 图 像 过 度 分 割 ， 需 要 后 续 进 行 合并 ， 基 于 标记 控制 的 分 水 岭 算法 可 很 好 地 避免 这 一 问题 。 
al 


章 中 提 到 直方 图 相似 度 比较 方法 实现 对 过 度 分 割 图 像 块 的 合并 。 基 于 上 述 基 本 思想 ， 这 里 实现 图 像 分 水 岭 分 割 的 步骤 大 致 如 下 : 
1) 将 输入 的 彩色 图 像 转 换 为 灰 度 图 像 。 
2) 使 用 Sobel 算 子 对 灰 度 图 像 实现 梯度 计算 。 
3) 使 用 梯度 图 像 完成 图 像 分 水 岭 变 换 。 
4) 对 分 水 岭 变 损 以 后 的 图 像 进行 组 件 标记 。 
5) 基于 巴 氏 距离 ， 使 用 直方 图 相似 度 比较 方法 实现 分 割 组 件 合 并 。 
6) 根据 组 件 内 像素 平均 值 之 间 的 距离 ， 合 并 删除 较 小 分 割 组 件 。 


7) 输出 结果 。 


数字 图 像 处 理 一 个 分 支 学 科 ， 图 像 分 水 岭 算法 是 图 像 形态 学 中 重要 的 算法 之 一 ， 最 常见 的 是 通过 Luc Vincent 和 Pierre Soille 提 出 的 漫 水 浸泡 算法 来 实现 。 对 彩色 图 像 进行 分 割 时 ， 首 先 要 


到 最 终 的 分 割 以 后 的 图 像 。 


但 是 基于 标记 控制 的 分 水 岭 分 


会 涉及 更 多 的 图 像 形态 学 知识 ， 所 以 基于 本 书 前 面 章节 的 知识 基础 ， 这 里 所 采用 的 方法 是 基于 梯度 图 像 来 完成 图 像 分 水 岭 分 割 ， 梯 度 计算 采用 Sobel 算 子 完成 ， 使 用 分 水 岭 算 法 对 图 像 分 割 以 后 ， 使 用 第 6 


上 述 各 个 步骤 对 以 前 章节 介绍 的 知识 都 有 涉及 ， 相 关 知 识 点 此 处 不 表 袭 述 ， 读 者 如 有 疑问 可 以 查阅 相关 章节 。 这 里 要 强调 的 是 图 像 分 水 岭 分 割 的 方法 有 很 多 ， 虽 然 实践 上 干 差 万 别 ， 但 是 其 基本 思想 都 


基于 图 像 分 水 变换 算法 ， 同 时 要 解决 图 像 过 度 分 割 的 问题 。 
2. 代 码 实 现 
基于 上 述 思 路 ， 实 现代 码 大 致 可 以 分 为 如 下 几 个 步骤 : 
1) 对 输入 彩色 图 像 完成 灰 度 化 ， 实 现代 码 片段 如 下 : 


// 图 像 灰 度 化 
int[] inPixels = new int[width*height]; 
int[] outPixels = new int[width*height]; 
getRGB ( src, 0, 0, width, height, inPixels ) ; 
int index = 0; 
for (int row-0; row<height; rowt+) { 
int ta = 0, tr=0, tg=0, tb= 0; 
for (int col=0; col<width; col++) { 


index = row * width + col; 

ta = (inPixels[index] >> 24) & Oxff; 
(inPixels[index] >> 16) & Oxff; 

(inPixels[index] >> 8) & Oxff; 

inPixels[index] & Oxff; 

int gray= (int) (0.299 *tr + 0.587*tg + 0.114*tb) ; 

outPixels[index] = gray; 
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2) 基于 灰 度 图 像 实现 梯度 计算 ， 实 现代 码 片段 如 下 : 


// 梯度 计算 
int[] gradientResult = gradient (outPixels, width, height) ; 
SetRGB ( dest, 0, 0, width, height, gradientResult ) ; 


3) 基于 梯度 图 像 实现 分 水 岭 变换 ， 实 现代 码 片 段 如 下 : 


// 分 水 岭 变换 
WatershedTransform wt = new WatershedTransform () ; 
dest = wt.filter (dest, null) ; 


4) 基于 分 水 岭 变 换 结果 ， 完 成 组 件 标 记 ， 实 现代 码 片 段 如 下 : 


// 区 域 标记 

getRGB ( dest, 0, 0, width, height, outPixels ) ; 

List«PixelPoint» pixelList = new ArrayList«PixelPoint» () ; 

// 初始 化 每 个 像素 节点 状态 

for (int row-0; row«height; rowt+) { 

for (int col=0; col«width; col++) { 
index = row * width + col; 
PixelPoint p = new PixelPoint (row, col, (outPixels[index] >> 16) & Oxff) ; 
pixelList.add (p) ; 


} 


} 

// 添加 每 个 像素 节点 的 四 邻 域 像素 

for (int row-0; row«height; rowt+) { 

for (int col=0; col«width; col++) { 
index = row * width + col; 
PixelPoint p = pixelList.get (index) ; 
// add four neighbors for each pixel 

f ( (row - 1) >= 0) 


-— 


{ 
index = (row-1) * width + col; 
p.addNeighour (pixelList.get (index) ) ; 


if ( (row + 1) < height) 


index = (row4l) * width + col; 
p.addNeighour (pixelList.get (index) ) ; 


if ( (col = 1) >= 0) 


index = row * width + col-1; 
p.addNeighour (pixelList.get (index) ) ; 


if ( (col+1) < width) 


index = row * width + col+1; 
p.addNeighour (pixelList.get (index) ) ; 


} 


} 

// 深度 优先 搜索 算法 ， 连 通 组 件 标记 

DFSAlgorithm dfs = new DFSAlgorithm (pixelList) ; 
dfs.process () ; 


5) 基于 组 件 标记 结果 ， 完 成 巴 氏 直方 图 相似 度 合并 ， 其 中 要 求 相似 度 大 于 0.8。 实 现代 码 片 段 如 下 : 


// 直方 图 相似 度 合并 


[nteger[] labelKeys = labelPixelMap.keySet () .toArray (new Integer[0]) ; 
double[][] allBins = new double[labelKeys.length][4*4*4]; 
for (int k-0; k<labelKeys.length; k++) 


{ 


ArrayList<PixelPoint> labeledPixels = labelPixelMap.get (labelKeys[k]) ; 
allBins[k] = calculateHistogram (labeledPixels, width, inPixels) ; 


} 
Arrays.fill (outPixels, -1) ; 

for (int k=0; k<labelKeys.length; k++) 
{ 


if (! labelPixelMap.containsKey (labelKeys[k]) ) continue; 
ArrayList<PixelPoint> labeledPixels = labelPixelMap.get (labelKeys[k]) ; 
double[] srcBins = allBins[k]; 

for (int i=0; i<labelKeys.length; i++) 

{ 


if (k == i) continue; 

if (! labelPixelMap.containsKey (labelKeys[i]) ) continue; 
double[] destBins = allBins[i]; 
if 

{ 
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(calculateBhattacharyya (srcBins, destBins) >0.8) 


int megerLabel - labeledPixels.get (0) .getLabel () ; 
for (PixelPoint mp : labelPixelMap.get (labelKeys[i]) ) 
{ 


index = mp.getY () * width + mp.getX () ; 
outPixels [index] = megerLabel; 


} 
labelPixelMap.remove (labelKeys[i]) ; 


} 
} 
for (PixelPoint pp : labeledPixels) 
{ 


index = pp.getY () * width + pp.getX () ; 
outPixels [index] = pp.getLabel () ; 


6) 删除 较 小 组 件 块 ， 假 设 组 件 中 包含 的 像素 数目 小 3000， 实 现 的 代码 片段 如 下 : 


for (int i=0; i«labelKeys.length; i++) 
{ 


double minDis = Double.MAX VALUE; 
int size = ccounts [i]; 

if (size > 3000) continue; 

int tag = -1; 

int foundIndex = -1; 

for (int j=0; j«labelKeys.length; j++) 
{ 


if (j == i) continue; 

if (ccounts[j] < 3000) continue; 

double dis = calculateEuclideanDistance (cmeans[j], cmeans[i]) ; 
] C 

{ 


(dis < minDis) 


minDis = dis; 
foundIndex = j; 
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f (foundIndex > 0) 


for (int f-0; f<outPixels.length; f++) 
{ 
if (outPixels[f] == labelKeys[i]) { 
outPixels[f] = labelKeys [foundIndex] ; 


7) 输出 分 割 图 像 的 代码 片段 如 下 : 


colorMap.clear () ; 
for (int i=0; i«outPixels.length; i++) 


{ 


Color c = getColor (outPixels[i], colorMap) ; 
outPixels[i] = (Oxff << 24) | (c.getRed () << 16) | (c.getGreen () << 8) | c.getBlue () ; 


完整 的 程序 源 代码 参见 源 文件 中 12-5 的 WatershedSegmentationAlgo.java， 其 中 组 件 标 记 中 用 的 深度 搜索 DFSAlgorithm.java 参 见 源 文件 中 第 10 章 的 相关 部 分 ，WatershedTransform.java 参 见 源 文 
件 中 第 11 章 相关 部 分 即 可 。 


图 像 分 水 岭 变换 没有 固定 的 步骤 ， 这 里 给 出 的 彩色 图 像 分 水 岭 分 割 是 笔者 自己 总 结 与 摸索 处 理 的 。 分 水 岭 分 割 最 主要 的 缺点 是 容易 导致 图 像 过 度 分 割 ， 解 决 这 个 问题 的 方法 有 很 多 ， 希 望 读者 可 以 自己 
尝试 ， 在 实践 中 磨 大 自己 的 技能 。 


12.6 小结 


本 章 主要 介绍 了 几 种 常见 的 图 像 分 割 方法 ， 在 介绍 这 些 方 法 时 ， 尽 量 做 到 少 讲 空话 ， 少 用 那些 生 涩 的 数学 公式 ， 而 多 用 语言 描述 与 简单 举例 来 帮助 大 家 理解 相关 知识 ， 通 过 详细 的 代码 实现 步骤 与 完整 
源 代 码 演示 了 每 一 种 介绍 的 图 像 分 割 方法 。 常 见 的 图 像 分 割 方法 还 有 基于 图 与 拓扑 的 最 大 流 与 最 小 割 方法 ， 基 于 高 斯 混合 模型 的 分 割 方法 等 ， 希 望 读者 能 够 进一步 阅读 相关 资料 ， 在 理解 与 掌握 本 章 内 容 的 
基础 上 继续 学 习 。 特 别 强调 的 是 源 代码 是 本 书 的 一 部 分 ， 请 读者 阅读 、 运 行 、 修 改 源 代码 ， 完 成 自己 版 本 的 各 种 图 像 分 割 方法 。 


另外 ， 本 章 中 涉及 的 数学 知识 主要 是 向 量 之 间 的 距离 计算 ， 并 没有 介绍 特别 复杂 的 数学 知识 与 公式 推导 ， 和 希望 读者 自己 阅读 相关 图 像 分 割 方 法 的 原理 数学 证 明 与 推导 ， 这 对 掌握 本 章 知识 大 有 帮助 。 


第 13 章 ”图 像 特征 的 提取 与 检测 


上 一 章 介绍 了 几 种 常见 的 图 像 分 割 方法 ， 加 上 了 对 前 面 所 学 知识 的 理解 与 运用 。 本 章 将 继续 基于 已 经 学 习 的 章节 知识 深入 了 解 图 像 特征 提取 这 一 图 像 处 理 领 域 的 重要 分 支 ， 当 然 本 章 内 容 有 限 ， 不 可 能 
深入 到 图 像 特征 提取 的 方方面面 ， 这 里 选取 介绍 的 内 容 都 是 图 像 特 征 提取 中 比较 常见 而 且 重 要 的 基础 知识 。 


图 像 特 征 可 能 包括 图 像 中 对 象 的 主要 特性 ， 比 如 边缘 、 角 点 、 纹 理 、 颜 色 等 。 图 像 特 征 提 取 在 模式 匹配 、 图 像 识 别 、 对 象 检测 等 方面 对 工业 检测 、 机 器 人 视 党 等 领域 有 着 重要 意义 。 常 见 的 图 像 特 征 提 
取 有 直线 检测 、 边 缘 检 测 、 角 点 检测 、 纹 理 提 取 、 图 像 多 尺度 金字 塔 特征 等 ， 这 些 内 容 本 章 均 有 涉及 ， 最 后 还 将 详细 剖析 经 典 sIFT 特 征 提取 算法 。 
13.1 颜色 特征 提取 


因为 图 像 像 素 值 数组 是 一 系列 的 数值 ， 所 以 从 本 质 上 来 说 ， 可 以 通过 一 些 简单 的 数学 统计 学 知识 来 实现 对 图 像 整 体 颜 色 特 征 的 表述 。 最 常见 的 颜色 特征 就 是 基于 RGB 色 彩 空间 每 个 通道 计算 Moments。 


一 阶 Moments 表 示 均 值 (means) 计算 公式 为 : 


= p 


其 中 Pi 表示 第 i 个 颜色 通道 在 像素 位 置 } 上 的 值 、N 表 示 总 的 像素 个 数 。 


二 阶 Moments 是 标准 方差 (Standard Deviation) ， 是 分 布 差 的 平方 根 ， 计 算 公 式 可 以 表示 为 : 


| N 


/ 


三 阶 Moments 表 示 偏 斜 度 (Skewness) ， 它 给 出 了 像素 值 分 布 的 不 对 称 度量 ， 计 算 公式 可 以 表示 为 : 


3 N 
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Skewness = | ( P. -ji 


若 对 RGB 像素 值 的 每 个 通道 都 计算 三 个 值 ， 就 可 以 得 到 RGB 色彩 空间 的 9 个 值 ; 转换 到 HSV 色 彩 空间 ， 对 H、3S、V 通 道 同 样 计算 这 三 个 值 ， 就 可 以 得 到 18 个 颜色 特征 值 。 编 程 实现 的 步骤 大 致 如 下 : 


2l 


1) 获取 输入 图 像 的 像素 数据 数组 。 
2) 分 别 在 RGB 色彩 空间 与 HSV 色 彩 空间 计算 均值 、 方 差 、 偏 斜 度 。 
3) 得 到 输出 的 18 个 颜色 特征 值 。 


实现 代码 如 下 : 


package com.book.chapter.thirteen; 
import java.awt.Color; 
import java.awt.image.BufferedImage; 
import com.book.chapter.four.AbstractBufferedImageOp; 
public class ColorFeatureExtractor extends AbstractBufferedImageOp { 
@Override 
public BufferedImage filter (BufferedImage src, BufferedImage dest) { 
int width = src.getWidth () ; 

t height = src.getHeight () ; 
if (dest == null) 

dest = createCompatibleDestImage (src, null) ; 

int[] inPixels = new int[width*height] ; 

src.getRGB ( 0, 0, width, height, inPixels, 0, width ) ; 
int index = 0; 


// 提取 像素 


loat[][] R=new float [height] [width]; 
Float[][] G=new float [height] [width]; 
Float[][] B=new float [height] [width]; 
Float[][] H=new float [height] [width]; 
Float[][] S=new float [height] [width]; 
Float[][] V=new float [height] [width]; 
Float hsv[]=new float[3]; 
for (int row=0; row<height; rowt+) ( 
for (int col-0; col«width; cole) { 


index = row * width + col; 
int argb = inPixels [index]; 
int (argb >> 16) & Oxff; 
j (argb >> 8) & Oxff; 
(argb) & Oxff; 
[row] [col]=r; 
[row] [col]=g; 
[row] [col ]=b; 
lor.RGBtoHSB 
[row] [col]=hsv [0]; 
] 
] 
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[row] [col]=hsv [1 
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) 
) 
// 提取 颜色 特征 值 


double[] redMSS = meanStdSkew (R, height, width) ; 
double[] greenMSS = meanStdSkew (G, height, width) ; 
double[] blueMSS = meanStdSkew (B, height, width) ; 
double[] hMSS = meanStdSkew (H, height, width) ; 
double[] sMSS = meanStdSkew (S, height, width) ; 
double[] vMSS = meanStdSkew (V, height, width) ; 

// 返回 结果 

System.out.println ("h = " + hMSS[0]) ; 
System.out.println ("s = " + sMSS[0]) ; 
System.out.println ("v = " + vMSS[0]) ; 


for (int row=0; row<height; row++) ( 
for (int col=0; col«width; cole) { 
index = row * width + col; 
inPixels [index] = (Oxff << 24) | ( ( (int) redMSS[0]) << 16 | ( ( (int) greenMSS[0]) << 8) | ( (int) blueMSS[0]) ; 


} 


setRGB (dest, 0, 0, width, height, inPixels) ; 
return dest; 


public static double[] meanStdSkew ( float[][] data, int height, int width ) 


double mean = 0; 

double[] out=new double[3]; 

for (int row=0; row<height; rowt+) { 

for (int col=0; col<width; col++) { 
mean += data[row] [col]; 


} 


} 

mean /= (height*width) ; 
out [0] 2mean; 

double sum - 0; 

for (int row=0; row<height; rowt+) ( 

for (int col=0; col«width; cole) { 

final double v = data[row][col] - mean; 
sum += v * v; 


} 


out[1]=Math.sqrt ( sum / ( height*width - 1) ) ; 

sum = 0; 

for (int row=0; row<height; rowt+) { 

for (int col=0; col<width; col++) { 

final double v = (data[row] [col] - mean) /out[1]; 
sum += v * v * v; 


out [2]=Math.pow (1+sum/ (height*width-1) , 1./3) ; 
return out; 


颜色 特征 计算 的 应 用 之 一 是 将 其 作为 基本 属性 建立 图 像 基于 颜色 的 索引 ， 要 运行 上 述 代码 ， 在 ImagePaneljava 的 process () 方法 中 添加 如 下 调用 代码 即 可 (第 3 章 有 介绍 ) : 


ColorFeatureExtractor filter = new ColorFeatureExtractor () ; 
destImage = filter.filter (sourceImage, null) ; 


Ñ 
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13.2 ”纹理 提取 


纹理 是 图 像 中 常见 的 特征 之 一 ， 常 见 的 三 种 纹理 包括 随机 块 、 方 向 块 、 连 续 块 ， 如 图 13-1 所 示 。 


方向 纹理 规则 纹理 


针对 不 同类 型 纹理 与 特征 ， 纹 理 提取 的 方法 也 有 很 多 ， 最 常见 两 种 统计 方法 是 基于 直方 图 与 共生 和 矩 阵 提 取 纹 理 特征 ， 另 外 一 种 是 基于 图 像 空间 域 Cabor 滤 波 提 取 。 较 复杂 的 有 基于 图 像 频 率 域 人 埔里 叶 变 
换 与 图 像 多 尺度 小 波 实现 纹理 特征 提取 ， 这 两 种 方法 本 书 不 会 讨论 ， 感 兴趣 的 读者 可 以 自己 研究 。 本 节 主 要 介绍 基于 共生 和 矩阵 实现 纹理 提取 的 方法 。 


1. 灰 度 共 生 和 矩阵 (co-occurrence matrices) 概念 


由 于 图 像 纹 理 是 灰 度 分 布 在 位 置 上 反复 出 现 而 形成 的 ， 因 此 在 图 像 空间 域 里 ， 相 隔 某 种 距离 的 两 个 像素 之 间 一 定 人 存在 着 某 种 联系 ， 这 种 联系 即 图 像 像素 的 空间 相关 性 ， 灰 度 共 生 和 矩阵 就 是 研究 图 像 灰 度 
空间 相关 性 来 进行 纹理 特征 描述 的 一 种 常见 方法 。 


灰 度 共生 矩阵 是 基于 灰 度 图 像 得 到 的 ， 基 于 统计 灰 度 像素 点 i 的 灰 度 值 在 0"、45"、90"、135" 方 向 与 指定 距离 的 像素 点 j 的 灰 度 值 同 时 出 现 次 数 而 生成 的 矩阵， 可 以 表示 为 P (i，j) ， 其 中 i、j 表 示 图 像 灰 
度 级 别 ， 四 个 角度 分 量 可 以 表示 为 Po、P45、P90、P135， 如 图 13-2 所 示 。 


135*[-D _D] 90*[_D 0] 45*[-D D] 


Pixel of interest 
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根据 统计 获得 的 灰 度 共生 和 矩阵 可 以 计算 纹理 下 列 相关 属性 。 


“对比度 (Contrast) : 计算 像素 与 周围 像素 对 整个 图 像 灰 度 的 度量 ，0 表 示 为 常量 图 像 ， 计 算 公 式 为 : 


contrast = 


: 相关 性 (Correlation) : 计算 像素 与 周围 像素 之 间 相 关 性 高 低 ， 取 值 范 围 为 [1，1]， 计算 公式 为 : 


i 
correlation — 2 (I 


能 量 (Energy) : 计算 矩阵 中 每 个 元 素 的 平方 之 和 ，1 表 示 为 常量 图 像 。 计 算 公式 为 : 


energy = 


2. 编 程 实现 

根据 上 述 介绍 ， 编 程 实现 图 像 灰 度 共生 和 矩阵 统计 的 大 致 步骤 如 下 : 
1) 将 输入 图 像 转换 为 灰 度 图 像 。 

2) 读 取 每 个 像素 值 ， 根 据 灰 度 值 生 成 共生 和 矩阵 。 

3) 计算 对 比 度 、 相 关 性 、 能 量 值 。 

4) 输出 结果 图 像 。 


程序 在 完成 时 还 需要 考虑 距离 D 参 数 的 大 小 ， 这 里 默认 距离 D = 1。 根 据 步 又 描述 ， 实 现 图 像 转 为 灰 度 图 像 的 代码 如 下 : 


// 图 像 灰 度 化 


int[] pixels = new int[width* height]; 
getRGB ( src, 0, 0, width, height, pixels ) ; 
int index - 0; 


for (int row-0; row«height; rowt+) { 
int ta = 0, tr» 0, tg=0, tb= 0; 
for (int col=0; col<width; col++) { 


index = row * width + col; 

ta = (pixels[index] >> 24) & Oxff; 
tr = (pixels[index] >> 16) & Oxff; 
tg = (pixels[index] >> 8) & Oxff; 
tb = pixels[index] & Oxff 

int gray= (int) 


pixels[index] = (ta << 24) 


(gray << 16) 


(0.299 *tr + 0.587*tg + 0.114xtb) ; 


(gray << 8) 
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// 计算 共生 矩阵 


int offset = 0; 
double totalPixels - 0; 
double[][] coMatrix = new double [256] [256]; 
for (int row-0; row«height; rowt+) { 
for (int col=0; col«width; col++) { 


row * width + col; // i 
(pixels[index] »» 16) 
ZERO DEGREES) 


index = 
int igray - 
if (degrees 
{ 


offset = col + distance; 


if (offset >= width) 
{ 
continue; 
} 
index = row * width + offset; 
int jgray = (pixels[index] >> 


coMatrix[igray] [jgray] += 1; 
coMatrix[jgray][igray] += 1; 
totalPixels += 2; 


else if (degrees ANGLE 45 DEGREES 


offset = col + distance; 
if (offset »- width) 


a 


continue; 


oS 


< 0) 


if ( (row - distance) 


continue; 
} 
index = (row-distance) 
int jgray = (pixels[index] >> 
coMatrix[igray] [jgray] += 1; 
coMatrix[jgray] [igray] += 1; 
totalPixels += 2; 


else if (degrees ANGLE 90 DEGREES 


offset = row - distance; 
if (offset « 0) 
{ 


continue; 
} 
index = 
int jgray = 
coMatrix[igray] [jgray] += 1; 
coMatrix[jgray] [igray] += 1; 
totalPixels += 2; 


(offset) 


» 


» 


else if (degrees 


offset = col - distance; 


if (offset « 0) 

continue; 

ie ( (row - distance) < 0) 
l continue; 

E = (row-distance) 


int jgray = 
coMatrix[igrayl[jgray] += 1 
coMatrix[jgray] [igray] += 1; 
totalPixels += 2; 


ve 


» 


根据 灰 度 共生 和 矩阵 数据 计算 对 比 度 的 代码 实现 如 下 : 


(pixels[index] >> 16) 


& Oxff; 


16) & Oxff; 


) 


* width + offset; 


16) & Oxff; 


) 


* width + col; 
(pixels[index] »» 16) 


& Oxff; 


ANGLE 135 DEGREES) 


* width + offset; 


& Oxff; 


| gray; 


// calculates the contrast 

double contrast=0.0; 

for (int i-0; i<256; i++) { 

for (int j=0; j«256; j++) { 
contrast=contrast+ (i-j) * (i-j) * ( 


} 


coMatrix[i][j]) ; 


根据 灰 度 共 生 和 矩阵 数据 计算 能 力 的 代码 实现 如 下 : 


// calculates the angular second moment - ASM 
double asm-0.0; 


for (int i=0; i«256; i++) { 
for (int j=0; j«256; j++) { 
asm-asmt (coMatrix[i] [j]*coMatrix[i][j]) ; 


} 


根据 灰 度 共生 和 矩阵 数据 计算 相关 性 的 代码 实现 如 下 : 


// 计算 和 
double pi = 0; 
double pj = 0; 
for (int i20; i«256; i++) { 
for (int j=0; 4<256; j++) { 


pi=pit+ixcoMatrix [i] [J]; 
pj=pj+j*coMatrix [i] [J]; 


} 

// 计算 方差 
double stdevi 
double stdevj 0; 

for (int i20; i<256; i++) { 

for (int j=0; 4<256; j++) { 
stdevi-stdevi- (i-pi) * (i-pi) *coMat 


0; 


is 


trix [i] [J 


stdevj=stdevj+ (j-pj) * (j-pj) *coMa! 


— 
vew 


trix [i] [J 


} 
// 计算 相关 性 
double correlation - 0; 
for (int i-0; i«256; i++) { 
for (int j-0; j«256; j++) 
correlation=correlation+ ( (i-pi) * (j-pj) *coMatrix [i][j]/ (stdevi*stdevj) ) 
} 


kd 


整 的 灰 度 共生 和 矩阵 代码 实 
共 等 


完 现 参见 源 文件 中 13-02 的 CoOccurrenceMatrixFilterjava 即 可 ， 运 行 与 测试 该 代码 可 以 参考 以 前 章节 中 提 到 的 调用 方法 。 这 里 需要 特别 说 明 一 下 的 是 ， 上 述 步 骤 中 计算 得 至 
的 灰 度 共生 和 矩阵 在 计算 对 比 度 


属性 之 前 需要 归 一 化 处 理 ， 具 体 代码 参见 源 代码 文件 ， 这 里 不 表 袭 述 。 


13.3 ”直线 检测 


直线 也 是 图 像 中 几何 特征 的 一 种 ， 水 平 或 垂直 方向 的 直线 可 以 使 用 图 13-4 所 示 的 两 个 检测 算 子 。 


角度 为 45" 或 135 "方向 的 直线 则 使 用 图 13-5 中 的 检测 算 子 。 


He ELT qn] 


图 13-4 ”水平 与 重 直 方向 算 子 


1357 77 [n] 
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上 述 四 个 算 子 只 能 


对 一 些 简单 图 像 实现 直线 检测 ， 对 于 一 些 复杂 的 图 像 对 象 ， 直 线 很 难 做 到 正确 检测 。 在 实际 应 用 中 ， 更 为 人 知 的 直线 检测 方法 是 基于 霍 夫 变换 实现 的 ， 霍 夫 变换 


法 之 一 ， 主 要 用 来 从 图 像 中 分 离 具 有 某 种 相同 特征 的 几何 形状 ， 比 如 圆 、 直 线 等 


是 经 典 的 图 像 变换 方 
等 。 霍 夫 变 换 检测 直线 的 方法 与 其 他 方法 相 比 ， 可 以 更 好 地 抗 噪声 干扰 。 


1. 基 本 原理 


霍 夫 变 换 检测 直线 的 基本 原理 是 把 每 个 像素 坐标 点 经 过 变换 都 变 成 对 直线 特质 有 贡献 的 统一 度量 。 一 个 简单 的 例子 如 下 : 一 条 直线 在 图 像 中 是 一 系列 离散 点 的 集合 ， 通 过 一 个 直线 的 离散 极 坐标 公式 ,， 


a 
A, 
Fa, 其 中 r、6 是 常量 。 该 公式 的 图 形 表示 如 


= 


图 13-6 所 示 。 
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图 13-6 ”直线 极 坐 标 


然而 在 实际 的 图 像 处 理 过 程 中 ， 一 般 图 像 的 像素 坐标 P (x, y) 是 已 知 的 ，r、theta 则 是 我 们 要 寻找 的 变量 。 如 果 能 根据 像素 点 坐标 P (x, y) EEA (r, theta) ， 那 么 就 将 图 像 从 笛 卡 儿 坐标 系统 
转换 到 极 坐 标 霍 夫 空间 系统 ， 这 种 从 点 到 曲线 的 变换 称 为 直线 的 零 夫 变 换 。 在 使 用 翟 夫 变换 算法 时 ， 每 个 像素 坐标 点 P_(x，y) 都 会 被 转换 到 (r，9) 的 曲线 点 上 面 ， 累 加 到 对 应 的 格子 数据 点 ， 当 一 个 波峰 


出 现时 ， 说 明 有 直线 存在 。 这 里 假设 9 的 取 值 范围 为 [0*，180"] 之 间 ， 步 长 为 1， 当 然 为 了 获得 更 加 准确 的 结果 可 以 将 步 长 变 小 。 
2. 实 现 
根据 上 述 原 理 ， 实 现 利用 霍 夫 变换 完成 直线 检测 大 致 需要 如 下 几 步 : 
1) 初始 化 霍 夫 变 换 空间 、 极 坐标 空间 ， 角 度 为 0*~180°， 最 大 可 能 半径 长 度 为 输入 图 像 宽 与 高 的 平方 根 。 
2) 将 图 像 的 2D 空 间 转换 到 霍 夫 空间 ， 每 个 像素 坐标 都 要 转换 到 霍 夫 极 坐 标的 对 应 强度 值 。 
3) 找 出 霍 夫 极 坐 标 空间 的 最 大 强度 值 。 
4) 根据 最 大 强度 值 归 一 化 ， 范 围 为 0~255。 
5) 根据 输入 前 accSize 值 找 出 前 accSize 个 信号 最 强 的 直线 。 
6) 根据 在 霍 夫 空间 找到 的 结果 ， 在 像素 空间 画 出 检测 得 到 的 直线 。 


第 一 步 ， 初 始 化 申 夫 变换 空间 的 代码 实现 如 下 : 


int rmax = (int) Math.sqrt (width * width + height * height) ; 
acc = new int[rmax * 180]; // 0 ~ 180€ X4 
int r; 


第 二 步 ， 将 图 像 2D 空 间 像素 点 P_ (x, y) 从 笛 卡 儿 坐 标 变换 为 极 坐 标的 代码 实现 如 下 : 


for (int x = 0; x < width; x++) { 
for (int y=0; y < height; yt+) { 


if ( (input[y * width + x] & Oxff) == 255) | 
for (int theta = 0; theta < 180; thetat++) { 
pos (int (x * Math.cos ( ( (theta) * Math.PI) / 180) + y * Math.sin ( ( (theta) * Math.PI) / 180) ) ; // 像素 点 p (x, y) 转换 为 对 应 的 强度 值 


if ((r»0) && (r <= rmax) ) 
acc[r * 180 + theta] = acc[r * 180 + theta] + 1; // 强度 值 增加 1 
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// 找到 极 坐标 空间 的 最 大 强度 值 
int max = 0; 
for (r = 0; r < rax; r+) { 
for (int theta = 0; theta < 180; theta++) { 
if (acc[r * 180 + theta] > max) { 
// swap the max value 
max = acc[r * 180 + theta]; 


第 四 步 ， 根 据 最 大 与 最 小 强度 值 ， 完 成 归 一 化 的 代码 实现 如 下 : 


// normalization all the values, 归 一 化 处 理 

int value; 

for (r20; r < rmax; r++) { 

for (int theta = 0; theta < 180; thetat+) { 
value = (int) ( ( (double) acc[r * 180 + theta] / (double) max) * 255.0) ; 
acc[r * 180 + theta] = Oxff000000 | (value << 16 | value << 8 | value) ; 


第 五 步 ， 根 据 输入 N 在 霍 夫 空间 中 寻找 前 N 个 最 大 值 的 "”6， 以 及 强度 值 ， 代 码 如 下 : 


// 极 坐 标 中 最 大 的 半径 值 
int rmax = (int) Math.sqrt (width * width + height * height) ; 
results = new int[accSize * 3]; 
int[] output = new int[width * height]; 
// 根据 输入 参数 ， 找 到 前 accSize 个 极 坐 标 空间 中 强度 最 大 的 直线 R 值 
for (int r = 0; r < rmax; r++) ( 
for (int theta = 0; theta < 180; theta++) { 
int value = (acc[r * 180 + theta] & Oxff) ; 
// i£ its higher than lowest value add it and then sort 
if (value > results[ (accSize - 1) * 3]) { 
// add to bottom of array 


results[ (accSize - 1) * 3] = value; 
results[ (accSize - 1) * 3 + 1] = r; 
results[ (accSize - 1) * 3 + 2] = theta; 
// shift up until its in right place 

int i= (accSize - 2) * 3; 


while ( (i >= 0) && (results[i + 3] > results[i]) ) 1 
for (int j 20; j < 3; j++) { 
i = results[i + j]; 
results[i + j] = results[i + 3 + j]; 
[i + 3 + j] = temp; 


第 六 步 ， 根 据 第 五 步 的 结果 ， 在 像素 空间 标 出 找到 前 N 个 直线 位 置 ， 用 红色 标记 ， 代 码 如 下 : 


// 根据 极 坐 标记 录 的 R 值 ， 匹 配对 应 的 像素 点 ， 绘 制 出 检测 到 的 直线 
System.out.println ("Total " + accSize + " matches: ") ; 
for (int i = accSize - 1; i >= 0; i--) { 
drawPolarLine (results[i * 3], results[i * 3 + 1], results[i * 3 + 2]) ; 


} 


方法 drawPolarLine () 的 实现 代码 如 下 : 


// 绘制 直线 方法 
private void drawPolarLine (int value, int r, int theta) { 
for (int x = 0; x < width; x++) { 
for (int y= 0; y < height; yt^) { 
int temp = (int) (x * Math.cos ( ( (theta) * Math.PI) / 180) + y * Math.sin ( ( (theta) * Math.PI) / 180) ) ; 
if ( (temp - r) == 0) // 匹配 对 应 像素 点 ， 绘 制 直 线 
output[y * width + x] = Oxffff0000; // 结果 直线 为 红色 


完整 的 霍 夫 变换 直线 检测 实现 源 代码 参见 源 文 件 中 13-03 的 LineHough.java 即 可 ， 其 中 参数 accSize 表 示 程 序 检测 之 后 输出 待 检测 直线 的 数目 。 


完整 的 测试 代码 HoughFilterjava 同 样 位 于 源 文 件 中 的 13-03。 这 里 直线 检测 是 基于 二 值 图 像 实现 的 ， 同 时 直线 中 有 段 点 可 能 会 影响 结果 ， 感 兴趣 的 读者 可 以 自己 进一步 探索 。 


13.4 EHEN 


上 一 节 介 绍 了 基于 霍 夫 变 换 实现 直线 检测 的 基本 原理 与 方法 ， 本 节 介 绍 基于 霍 夫 变 换 实现 圆 检 测 的 基本 原理 与 方法 ， 基 于 霍 夫 变 换 来 检测 圆 也 是 霍 夫 变换 的 经 典 应 用 之 一 ， 在 很 多 开源 的 图 像 处 理 库 中 
都 有 实现 ， 本 节 主 要 探讨 基本 原理 与 方法 ， 不 涉及 优化 与 广义 霍 夫 检 测 等 内 容 。 


1. 基 本 原理 


对 于 任意 2D 空 间 上 的 像素 点 P (x, y) ， 如 果 属 于 圆 上 一 点 ， 则 转换 为 极 坐 标 参数 方程 如 下 : 


= ^0. tr 


其 中 (xo, yo) 表示 圆心 坐标 ，6 值 表示 旋转 角度 ，r 表 示 圆 的 半径 ， 所 以 对 于 任意 一 个 圆 ， 假 设 圆 中 心 像素 点 P_ (x0，yo) 已 知 ， 圆 半径 6 已 知 ， 则 旋转 360" 由 极 坐 标 方程 可 以 得 到 该 圆 每 个 点 上 的 坐标 ; 同 
样 如 果 已 经 知道 图 像 上 像素 点 P (x, y) 、 圆 半径 r、 旋 转 360"， 则 得 到 圆心 点 处 的 坐标 值 必定 最 强 。 这 正 是 翟 夫 变换 检测 圆 的 数学 原理 。 


2. 买 现 


将 


根据 上 述 基 本 原理 ,编程 实现 霍 夫 变 换 大 致 可 以 分 为 如 下 几 步 : 

1) 将 图 像 中 非 背 景 像素 点 从 2D 平 面 空 间 转 换 到 极 坐 标 空间 。 

2) 在 极 坐标 空间 中 使 用 最 大 最 小 方法 归 一 化 ， 值 范围 为 0~255 之 间 。 

3) 根据 输入 参数 N， 寻 找 前 N 个 信号 最 强 的 圆心 。 

4) 根据 输入 参数 半径 大 小 ， 绘 制 出 当前 检测 结 

5) 返回 结果 像素 数组 ， 显 示 为 图 片 。 

上 述 实现 霍 夫 圆 检测 的 步骤 中 需要 输入 圆 半径 参数 1 与 待 检 测 圆 的 数目 。 其 中 对 于 圆 半径 参数 ， 还 可 以 改 为 最 小 值 Rmin 与 最 大 值 Rmax 之 间 的 范围 来 进行 检测 。 分 步骤 代码 详解 如 下 。 


第 一 步 ， 将 图 像 中 非 背 景 像素 点 从 平面 空间 转换 到 极 坐 标 空间 的 代码 实现 如 下 : 


// 对 于 圆 的 极 坐 标 变换 来 说 ， 我 们 需要 360 度 的 空间 梯度 登 加 值 
acc = new int[width * height]; 
for (int y= 0; y < height; y++) { 
for (int x = 0; x < width; x++) { 
acc[y * width + x] = 0; 
} 


} 

int x0, y0; 

double t; 

for (int x = 0; x < width; x++) { 

for (int y=0; y < height; yt) { 

if ( (input [y * width + x] & Oxff) == 255) { 

for (int theta = 0; theta < 360; theta++) | 
t = (theta * 3.14159265) / 180; // 角度 值 0 ~ 2*PI 
x0 (int) Math.round (x - r * Math.cos (t) ) ; 
yO (int) Math.round (y - r * Math.sin (t) ) ; 

if (x0 < width && x0 > 0 && yO < height && yO > 0) { 
acc[x0 + (yO * width) ] += 1; 

} 


第 二 步 ， 在 极 坐 标 空间 完成 数组 归 一 化 的 代码 实现 如 下 : 


// Find max acc value 
for (int x = 0; x < width; x++) { 
for (int y=0; y< height; yt) { 


if (acc[x + (y * width) ] > max) { 
max = acc[x + (y * es 
} 


} 
} 
// 根据 最 大 值 ， 实 现 极 坐 标 空 间 的 灰 度 值 归 一 化 处 理 


int value; 

for (int x = 0; x < width; x++) { 

for (int y=0; y < height; yt+) { 
value = (int) ( ( (double) acc[x + (y * width) ] / (double) max) * 255.0) ; 
acc[x + (y * width) ] = Oxff000000 | (value << 16 | value << 8 | value) ; 


第 三 步 ， 根 据 输入 参数 N， 寻 找 前 N 个 信号 最 强 的 圆心 


results = new int[accSize * 3]; 
int[] output = new int[width * height]; 
// 获取 最 大 的 前 accSize 个 值 
for (int x = 0; x < width; x^^) { 
for (int y=0; y < height; yt^) { 
int value = (acc[x + (y * width) ] & Oxff) ; 
// if its higher aint lowest value add it and then sort 
if (value > results[ (accSize - 1) * 3]) { 
// add to on of array 
results[ (accSize - 1) * 3] = value; // 像 素 值 


results[ (accSize - 1) * 3+ 1] =x; // 坐标 X 

results[ (accSize - 1) * 3 + 2] = y; // 坐标 Y 

// shift up until its in right place 

int i= (accSize - 2) * 3; 

while ( (i >= 0) && (results[i + 3] > results[i]) ) { 

for (int j = 0; j < 3; j++) { 

int temp = results[i + j]; 
results[i + j] = results[i + 3 + j]; 
results[i + 3 + j] = temp; 


} 

i-2i-3 

if (i < 0) 
break; 


第 四 步 ， 根 据 圆心 与 半径 ， 转 换 到 平面 坐标 画 出 圆 ， 代 码 如 下 : 


// 根据 找到 的 半径 R， 中 心 点 像素 坐标 P (x, y) ， 在 原 图 像 上 绘制 贺 
System.out.println ("top " + accSize + " matches: ") ; 
for (int i = accSize- 1; i >= 0; i--) ( 
drawCircle (results[i * 3], results[i * 3 + 1], results[i * 3 + 2]) ; 


} 


其 中 方法 drawCircle () 的 代码 如 下 : 


250; // 颜色 值 ， 默 认为 白色 


intx, y, r2; 


r2 —-r * f; 

// 绘制 圆 的 上 下 左右 四 个 点 

setPixel (pix, xCenter, yCenter + radius) 
setPixel (pix, xCenter, yCenter - radius) 
setPixel (pix, xCenter + radius, yCenter) 
setPixel (pix, xCenter - radius, yCenter) 


weve E 


(int) (Math.sqrt (r2 - 1) + 0.5) ; 

// 边缘 填充 算法 ， 其 实 可 以 直接 通过 循环 所 有 像素 、 计 算 到 中 心 点 的 距离 来 做 
// 这 个 方法 是 别人 写 的 ， 超 赞 ! 

while (x < y) { 


setPixel (pix, xCenter + x, yCenter + y) ; 
setPixel (pix, xCenter + x, yCenter - y) ; 
setPixel (pix, xCenter - x, yCenter + y) ; 
setPixel (pix, xCenter - x, yCenter - y) ; 
setPixel (pix, xCenter + y, yCenter + x) ; 
setPixel (pix, xCenter + y, yCenter - x) ; 
setPixel (pix, xCenter - y, yCenter + x) ; 
setPixel (pix, xCenter - y, yCenter - x) ; 


x += 1; 
y= (int) (Math.sqrt (r2 - x * x) + 0.5) ; 


G 


if (x= y) 4 
setPixel (pix, xCenter + x, yCenter + y) ; 
setPixel (pix, xCenter + x, yCenter - y) ; 
setPixel (pix, xCenter - x, yCenter + y) ; 
setPixel (pix, xCenter - x, yCenter - y) ; 


第 五 步 ， 输 出 处 理 后 的 像素 数组 作为 图 片 显 示 ， 代 码 如 下 : 


CircleHough ch = new CircleHough () ; 

ch.init (inPixels, width, height, 40) ; 

outPixels = ch.process () ; 

SetRGB ( dest, 0, 0, width, height, outPixels ) ; 


在 图 像 数 组 由 平面 坐标 空间 变换 到 霍 夫 空 间 以 后 ， 人 处 理 得 到 圆 与 直线 在 霍 夫 空 间 的 特征 显示 ， 和 转换 为 图 像 显 示 ， 实 现 的 代码 如 下 : 


width = src.getWidth () ; 

height = src.getHeight () ; 

if ( dest == null ) 

dest = createCompatibleDestImage ( src, null ) ; 
int[] inPixels = new int[width*height] ; 

getRGB ( src, 0, 0, width, height, inPixels ) ; 

if (type == INE TYPE) 

{ 


ch ct 


LineHough lh = new LineHough () ; 

lh.init (inPixels, width, height) ; 

lh.process () ; 

int rmax = (int) Math.sqrt (width*width + height*height) ; 

BufferedImage houghImage = new BufferedImage (180, rmax, BufferedImage.TYPE INT ARGB) ; 
SetRGB ( houghImage, 0, 0, 180, rmax, lh.getAcc () ) ; 

return dest; 


else if (type == IRCLE TYPE) 


CircleHough ch = new CircleHough () ; 

ch.init (inPixels, width, height, 40) ; 

ch.process () ; 

SetRGB ( dest, 0, 0, width, height, ch.getAcc () ) ; 
return dest; 


else 


throw new IllegalArgumentException ("Warning: not supported typehttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/OEBPS/Text/.. 


上 面 代码 中 方法 Ih.getAcc () 即 返 回 霍 夫 空间 特征 数组 ， 完 整 的 调用 霍 夫 直线 与 圆 检测 的 代码 实现 参见 源 文件 中 13-03 的 HoughFilterjava， 输 入 参数 type 表 示 圆 检测 或 直线 检测 。 基 于 霍 夫 变换 实现 
圆 检测 原理 方法 ， 本 节 就 介绍 到 这 里 ， 感 兴趣 的 读者 可 以 在 此 基础 上 将 输入 圆 半径 从 指定 值 变 为 最 大 最 小 值 范围 ， 继 续 修改 该 程序 ， 运 行 实现 自己 的 版 本 。 


135 ”图像 金 字 塔 
图 像 金字 塔 可 以 看 成 一 系列 分 辨 率 从 高 到 低 的 图 像 集 合 组 成 ， 最 下 层 的 图 像 分 辨 率 最 高 ， 最 上 层 的 图 像 分 辩 最 低 ， 但 是 图 像 内 容 相 同 。 图 像 金字 塔 在 图 像 压缩 、 视 觉 检测 、 图 像 融合 等 方面 都 有 实际 应 


用 价值 与 意义 。 


1. 金 字 塔 概述 


对 一 张 图 像 不 断 地 模糊 之 后 向 下 采样 ， 得 到 不 同 分 辨 率 的 图 像 ， 同 时 每 次 得 到 的 新 的 图 像 宽 与 高 是 原来 图 像 的 1/2， 见 就 是 基于 高 斯 的 模糊 之 后 采样 ， 得 到 的 一 系列 图 像 称 为 高 斯 金字 塔 。 上 述 这 个 
过 程 称 为 金字 塔 的 REDUCE 过 程 ， 直 到 得 到 你 想 要 的 金字 塔 级 数 (GO, G1, G2..Gn) 。REDUCE 过 程 是 由 两 步 组 成 的 ， 分 别 是 高 斯 模糊 与 偶数 行 采样 ， 公 式 表 示 如 下 : 


" 7 
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其 中 W (m, n) =W (m) xW (n) 表示 5x5 的 高 斯 卷 积 核 W (0) =[ 了 -了 4“ 了. 地- 了}， 常 见 的 a 的 取 值 范围 为 [0.3，0.6]。 高 斯 金字 塔 还 可 以 通过 第 Gn 层 得 到 第 Gn_1 层 、 由 第 Gn_1 得 到 Gn_2 层 …. 
直到 GO， 该 过 程 称 为 高 斯 金字 塔 的 EXPAND 操 作 ， 同 样 公式 表示 如 下 : 


W(m,n)G,(2i - m,2j ^n) 


mzz-—Zmn 


EXPAND(G,) = 4 W(m,n)G, (S —m S m) 
(6) 24 Y, Y Wmm e (65.05 


在 expand 操 作 的 上 述 定义 中 必须 保证 2 5 2 为 整除 ,这 在 后 续 的 编程 实现 中 将 会 做 更 加 详细 的 描述 。 假 设 有 一 幅 数 字 图 像 T， 其 最 初 的 第 0 层 高 斯 金字 塔 Go 就 是 它 本 身 ， 根 据 G0 可 以 获得 其 下 
一 级 图 像 金字 塔 G1， 则 可 以 得 到 第 0 层 的 拉 普 拉 斯 金字 塔 为 L0=Go-EXPAND (G1) ， 以 此 类 推 ， 可 以 获得 图 像 完整 的 拉 普 拉 斯 金字 塔 。 完 整 的 关系 如 图 13- 7 所 示 。 


高 斯 金字 境 拉 普 拉 斯 金字 塔 


VT 
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图 13-7 高 斯 金字 塔 演 


2. 高 斯 不 同 (DOG) 


高 斯 不 同 (Difference Of Gaussian) 在 模糊 图 像 重 建 、 图 像 锐 化 、 角 点 检测 中 都 有 应 用 ， 高 斯 不 同 又 称 为 高 斯 消 数 差分 ， 是 指 同 一 幅 图 像 用 不 同 半径 的 高 斯 核 遂 数 模 糊 之 后 求 取 差 值得 到 ， 即 对 图 像 
用 不 同 的 高 斯 窗口 进行 低 通 滤波 ， 然 后 相 减 得 到 的 差 值 。 当 两 个 高 斯 窗口 取 值 比率 (1.6) 适当 时 可 以 看 成 LOG 算 子 的 近似 值 ， 而 使 用 上 面 提 到 的 公式 Lo=Go-EXPAND (G1) 进行 推导 从 其 结果 就 可 以 近似 


看 出 是 高 斯 不 同 (DOG) 。 关 于 高 斯 不 同 与 拉 普 拉 斯 高 斯 之 间 的 关系 与 联系 ， 其 数学 推导 与 证 明 是 一 个 很 长 的 话题 ， 感 兴趣 的 读者 可 以 自己 阅读 相关 资料 ， 这 里 就 不 再 歼 述 。 
3. 实 现 
编程 实现 高 斯 金字 塔 的 REDUCE 过 程 与 EXPAND 过 程 ， 以 及 高 斯 分 差 (DOG) 的 思路 大 致 如 下 : 
1) 首先 实现 一 个 5x 5 窗口 的 高 斯 模糊 类 。 


2) 根据 输入 参数 确定 金字 塔 级 数 (高 度 ) ， 进 行 REDUCE 操 作 建 立 高 斯 金字 塔 。 


3) 对 高 斯 金字 塔 的 每 一 层 完成 EXPAND 操 作 。 


4) 根据 第 2、3 步 的 结果 ， 得 到 拉 普 拉 斯 高 斯 金字 塔 。 


l a ] | | a 
根据 上 述 思 路 ， 首 先 第 一 步 需要 编程 实现 对 图 像 的 高 斯 模糊 ， 采 用 的 高 斯 模糊 核算 子 为 W (7) =p -4 了 人， 基于 该 一 维 高 斯 模糊 算 子 ， 实 现 一 维 高 斯 模糊 方法 代码 如 下 : 


private void blur (int[] inPixels, int[] outPixels, int width, int height) 
{ 


int subCol = 0; 
int index = 0, index2 = 0; 
float redSum=0, greenSum=0, blueSum=0; 
for (int row-0; row<height; rowt+) { 
int ta = 0, tr=0, tg=0, tb= 0; 
for (int col=0; col<width; col++) { 
// index = row * width + col; 
redSum=0; 
greenSum=0; 
blueSum=0 ; 
for (int m--2; m<=2; m++) { 
subCol = col * m; 
if (subCol < 0 || subCol >= width) { 


subCol = 0; 
} 
index2 = row * width + subCol; 
ta = (inPixels[index2] >> 24) & Oxff; 
tr = (inPixels[index2] >> 16) & Oxff; 
tg = (inPixels[index2] >> 8) & Oxff; 
tb = inPixels[index2] & Oxff; 


redSum += (tr * gaussianKeneral[m + 2] 
greenSum += (tg * gaussianKeneral[m + 
blueSum += (tb * gaussianKeneral [m + 2 
} 
outPixels[index] = (ta << 24) | (clamp (redSum) << 16) | (clamp (greenSum) << 8) | clamp (blueSum) ; 
index += height; 


调用 该 方法 ， 实 现 图 像 水 平 与 坚 直方 向 高 斯 模糊 的 代码 如 下 : 


int width = src.getWidth () ; 
int height = src.getHeight () ; 
if ( dest == null ) 


dest = createCompatibleDestImage ( src, null ) ; 
int[] inPixels = new int[width*height]; 
int[] outPixels = new int[width*height]; 
getRGB ( src, 0, 0, width, height, inPixels) ; 
blur ( inPixels, outPixels, width, height) ; // H Gaussian 


tRGB (dest, 0, 0, width, height, inPixels ) ; 
turn dest; 


u 
blur ( outPixels, inPixels, height, width) ; // V Gaussain 


第 二 步 ， 基 于 第 n 层 图 像 高 斯 模糊 结果 完成 图 像 下 采样 ， 得 到 高 斯 金字 塔 的 第 n + 1 层 的 代码 实现 如 下 : 


public BufferedImage[] pyramidDown (BufferedImage src) { 
BufferedlImage[] imagePyramids = new BufferedImage[level + 1]; 
imagePyramids[0] = src; 
whData = new int[level][2]; 
whData[0][0] = src.getWidth () ; 
whData[0][1] = src.getHeight () ; 
for (int i-1; i<imagePyramids.length; i++) { 
imagePyramids[i] = pyramidReduce (imagePyramids[i-1]) ; 
f (i < level) { 
whData[i] [0] = imagePyramids[i].getWidth () ; 
whData[i] [1] = imagePyramids[i].getHeight () ; 


Eds 


} 
} 


return imagePyramids; 


其 中 关键 操作 REDUCE 方 法 实现 代码 如 下 : 


int width = src.getWidth () ; 

int height = src.getHeight () ; 

BufferedImage dest = createSubCompatibleDestImage (src, null) ; 
int[] inPixels = new int[width*height]; 

int ow = width/2; 


int oh = height/2; 
int[] outPixels = new int([ow*oh]; 
getRGB (src, 0, 0, width, height, inPixels ) ; 
int inRow=0, inCol = 0, index = 0, oudex =0, ta = 0; 
float[][] keneralData = this.getHVGaussianKeneral () ; 
for (int row-0; row<oh; rowt++) { 
for (int col=0; col<ow; col++) { 
inRow = 2* row; 
inCol = 2* col; 
if (inRow >= height) { 
inRow = 0; 


if (inCol >= width) { 
inCol = 0; 


float sumRed = 0, sumGreen = 0, sumBlue = 0; 
for (int subRow = -2;  subRow <= 2; SubRow++) { 


int inRowOff = inRow + subRow; 
f (inRowOff >= height || inRowOff < 0) { 


inRowO = 0; 


H- 


} 

for (int subCol = -2; subCol <= 2; subCol++) { 
int inColOff = inCol + subCol; 

if (inColOff >= width || inColOff « 0) ( 


inColOff = 0; 
} 
index = inRowOff * width + inColOff; 
ta = (inPixels[index] >> 24) & Oxff; 
int red = (inPixels[index] >> 16) & Oxff 
int green = (inPixels[index] >> 8) & Oxff; 
int blue = inPixels[index] & Oxff; 


sumRed += keneralData[subRow + 2][subCol + 2] * red; 
sumGreen += keneralData[subRow + 2] [subCol + 2] * green; 
|I ] 


sumBlue += keneralData[subRow + 2][subCol + 2] * blue; 
} 
} 
oudex = row * ow + col; 
outPixels[oudex] = (ta << 24) | (clamp (sumRed) << 16) | (clamp (sumGreen) << 8) | clamp (sumBlue) ; 


} 


SetRGB ( dest, 0, 0, ow, oh, outPixels ) ; 
return dest; 


第 三 步 ， 基 于 建立 的 高 斯 金字 塔 实现 图 像 金字 塔 的 EXPAND 操 作 ， 代 码 如 下 : 


public BufferedImage[] pyramidUp (BufferedImage[] srcImage) { 
BufferedlImage[] imagePyramids = new BufferedImage[srcImage.length-1]; 
for (int i-1; i<srcImage.length; i++) { 

imagePyramids[i-1] = pyramidExpand (srcImage[i], i-1) ; 


) 


return imagePyramids; 


该 方法 要 求 输入 参数 为 高 斯 金字 塔 的 每 一 层 图 像 ， 其 中 实现 金字 塔 EXPAND 操 作 的 代码 如 下 : 


public BufferedImage pyramidExpand (BufferedImage src, int levelIndex) { 
int width = src.getWidth () ; 


int height = src.getHeight () ; 

System.out.println ("expand src.width = "+ width + " , src.height = " + height) ; 
int[] inPixels = new int[width*height]; 

getRGB (src, 0, 0, width, height, inPixels ) ; 


int ow = whData[levelIndex] [0]; 
int oh = whData[levelIndex] [1]; 
System.out.println ("expand exp.width = "+ ow +" , exp.height = " + oh) ; 


t[] outPixels = new int[ow * oh]; 

index = 0, outdex = 0, ta = 0; 

float[][] keneralData = this.getHVGaussianKeneral () ; 

BufferedImage dest = createTwiceCompatibleDestImage (src, null, levelIndex) ; 

for (int row-0; row<oh; rowt+) { 

for (int col=0; col<ow; col++) { 

float sumRed = 0, sumGreen = 0, sumBlue = 0; 

for (int subRow = -2;  subRow <= 2;  subRowt+) { 
double srcRow = (row + subRow) /2.0; 
double j = Math.floor (srcRow) ; 

double t = srcRow - j; 

if (t»0) | 


continue; 

} 

if (srcRow >= height || srcRow < 0) { 
srcRow = 0; 


} 
for (int subCol = -2; subCol <= 2; subColt++) { 


double srcColOff = (col + subCol) /2.0; 
j = Math.floor (srcColOff) ; 
t = srcColOff - j; 
if (t»0) { 
continue; 
} 
if (srcColOff >= width || srcColOff < 0) { 
srcColOff = 0; 
} 
index = (int) (srcRow * width + srcColOff) ; 
ta = (inPixels[index] >> 24) & Oxff; 
int red = (inPixels [index] >> 16) & Oxff; 
int green = (inPixels[index] >> 8) & Oxff; 
int blue = inPixels[index] & Oxff; 


sumRed += keneralData[subRow + 2][s 
sumGreen += keneralData[subRow + 2] [subCol 2] * green; 
[ ] 


sumBlue += keneralData[subRow + 2][subCol + 2] * blue; 
} 
} 
outdex = row * ow + col; 
outPixels[outdex] = (ta << 24) | (clamp (4.0f * sumRed) << 16) | (clamp (4.0f * sumGreen) << 8) | clamp (4.0f * sumBlue) ; 
// outPixels[outdex] = (ta << 24) | (clamp (sumRed) << 16) | (clamp (sumGreen) << 8) | clamp (sumBlue) ; 
} 
} 
SetRGB ( dest, 0, 0, ow, oh, outPixels ) ; 
return dest; 
} 
第 四 步 ， 计 算 图 像 的 拉 普 拉 斯 金字 塔 ， 实 现代 码 如 下 : 
public BufferedImage[] getLaplacianPyramid (BufferedImage[] reduceImages) { 


BufferedImage[] laplacilmages = new BufferedImage [reduceImages.length -1]; 
for (int i-1; i<reduceImages.length; i++) { 
BufferedImage expandImage = pyramidExpand (reduceImages[i], i-1) ; 
laplacilmages[i-1] = createCompatibleDestImage (expandImage, null) ; 


int width = reduceImages[i-1].getWidth () ; 

int height = reduceImages[i-1].getHeight () ; 

int ewidth = expandImage.getWidth () ; 

width = (width > ewidth) ? ewidth : width; 

height = (height > expandImage.getHeight () ) ? expandImage.getHeight () : height; 


System.out.println (" width = " + width + " expand width = " + ewidth) ; 
int[] reducePixels = new int[width*height] ; 

int[] expandPixels = new int[width*height] ; 

int[] laPixels = new int[width*height] ; 


getRGB ( reduceImages[i-1], 0, 0, width, height, reducePixels) ; 
tRGB ( expandImage, 0, 0, width, height, expandPixels ) ; 
index = 0; 
int er = 0, eg=0, eb=0; 
for (int row-0; row<height; rowt+) { 
int ta = 0, tr=0, tg=0, tb= 0; 
for (int col=0; col<width; col++) { 
index = row * width + col; 
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ta = (reducePixels[index] >> 24) & Oxff; 
tr = (reducePixels[index] >> 16) & Oxff; 
tg = (reducePixels[index] >> 8) & Oxff; 
tb = reducePixels[index] & Oxff; 

ta = (expandPixels[index] >> 24) & Oxff; 


er = (expandPixels[index] >> 16) & Oxff; 


eg = (expandPixels[index] >> 8) & Oxff; 

eb = expandPixels[index] & Oxff; 

tr = (tr - er); 

tg = (tg = eg) ; 

to = (tb - eb) ; 

laPixels [index] = (ta << 24) | (clamp (tr) «« 16) | (clamp (tg) << 8) | clamp (tb) ; 


} 


} 
SetRGB ( laplaciImages[i-1], 0, 0, width, height, laPixels ) ; 


} 


return laplacilmages; 


完整 的 图 像 金 字 塔 实现 源 代 码 参见 源 文件 的 13-05 中 源 代码 文件 pyramidAlgorithm java 与 GaussianFilterjava， 测 试 类 为 pyramidDemoUljava 源 代码 文件 ， 关 于 图 像 金 字 塔 与 代码 实现 ， 本 节 就 介绍 
到 这 里 ， 源 代码 也 是 本 书 内 容 的 一 部 分 ， 阅 读 与 运行 本 节 代码 有 助 于 读者 更 好 地 理解 本 节 内 容 。 
13.6 ”Harris 角 度 检测 


Harris 角 度 检 测 是 通过 数学 计算 在 图 像 上 发 现 角 度 特征 的 一 种 算法 ， 而 且 其 具有 旋转 不 变性 的 特质 。 基 于 Harris 角 度 检测 改进 的 算法 一 一 Shi-Tomasi 角 度 检测 ， 在 很 多 领域 都 有 应 用 .。 


1. 基 本 原理 


Harris 角 度 检测 通过 寻找 本 地 响应 最 大 化 关键 点 来 实现 角 点 检测 ， 而 对 一 幅 图 像 来 说 ， 角 度 是 它 最 明显 与 重要 的 特征 之 一 ， 基 于 图 像 一 阶 导 数 处 理 ， 角 度 在 各 个 方向 的 变化 是 最 大 的 ， 而 边缘 区 域 只 在 


某 一 方向 有 了 明显 变化 ， 一 个 直观 的 图 示 见 图 13-8。 


平坦 区 域 边缘 区 域 角度 边缘 
在 所 有 方向 没有 在 某 个 方向 有 在 各 个 方向 梯度 值 
明显 梯度 变化 明显 梯度 变化 有 明显 变化 


图 13-8 边缘 效果 


根据 上 述 原理 ，Harris 角 度 检测 就 变 成 寻找 本 地 像素 点 在 X 与 Y 方 向 的 最 大 响应 ， 公 式 表示 如 下 : 
E(u = »W | TES y tv) —I(x,v) | 
(u,v) >. (x,y)l Mx +u,y +v Y 
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其 中 W (x, y) 是 窗口 国 数 ，| (x, y) 表示 像素 点 强度 值 ， 常 见 为 图 像 灰 度 值 。 上 述 公式 经 过 一 系列 的 数学 推导 ， 最 终 可 以 得 到 如 下 公式 : 
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其 中 M 是 根据 图 像 X 方 向 、Y 方 向 、XY 方 向 计算 导数 得 到 的 2x 2 的 矩阵， 表示 为 : 
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其 中 det M=A4A2, trace M = 入 1+ 入 2， 系数 k 常 见 的 取 值 范围 为 [0.04，0.06]。 关 于 Harris 角 度 检测 数学 知识 的 简单 介绍 就 到 这 里 为 止 ， 一 切 并 不 复杂 。 如 果 读 者 想 了 解 更 多 关于 Harris 角 度 检 测 的 数学 
推导 与 原理 ， 可 以 阅读 相关 文献 与 资料 。 从 上 面 的 介绍 读者 不 难看 出 ，Harris 角 度 检测 的 关键 在 于 计算 角度 响应 值 R。 
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2. 实 现 

基于 Harris 角 度 检测 的 原理 ， 编 码 实 现 Harris 角 度 检 测 的 大 致 步骤 如 下 : 
1) 计算 图 像 X 方 向 与 Y 方 向 的 一 阶 高 斯 偏 导数 lx 与 ly。 

2) 根据 第 一 步 结果 得 到 上. “与 lxly 的 值 。 

3) 高 斯 模糊 第 二 步 三 个 值得 到 Sxx、Syy 与 Sxy。 

4) 定义 每 个 像素 的 Harris 矩 阵 ， 计 算出 矩 阵 的 两 个 特质 值 。 


5) 计算 出 每 个 像素 的 R 值 。 


6) 使 用 3X3 或 5X5 的 窗口 ， 实 现 简单 的 非 最 大 值 压 制 。 
7) 根据 角度 检测 结果 计算 ， 以 绿色 标记 提取 到 的 关键 点 ， 显 示 在 原 图 上 。 


在 上 述 实现 中 ， 权 重 采 用 了 高 斯 函数 ， 第 三 步 是 可 选 步 又， 此 外 还 可 以 采用 Sobel 算 子 计算 丰 . 也 与 xly， 这 样 可 以 简化 第 一 步 与 第 二 步 的 计算 。 根 据 上 面 的 步骤 ， 实 现代 码 如 下 : 


int width = src.getWidth () ; 

int height = src.getHeight () ; 
initSettings (height, width) ; 
if ( dest == null ) 


dest = createCompatibleDestImage ( src, null ) ; 
BufferedImage grayImage = super.filter (src, null) ; 
int[] inPixels = new int[width*height] ; 
// first step - Gaussian first-order Derivatives (3 x 3) - X - gradient, (3 x 3) - Y - gradient 
filter.setDirectionType (GaussianDerivativeFilter.X DIRECTION) ; 
BufferedImage xImage = filter.filter (grayImage, null) ; 
getRGB ( xImage, 0, 0, width, height, inPixels ) ; 


ractPixelData (inPixels, GaussianDerivativeFilter.X DIRECTION, height, width) ; 
ilter.setDirectionType (GaussianDerivativeFilter.Y DIRECTION) ; 

BufferedImage yImage = filter.filter (grayImage, null) ; 

getRGB ( yImage, 0, 0, width, height, inPixels ) ; 


extractPixelData (inPixels, GaussianDerivativeFilter.Y DIRECTION, height, width) ; 
// second step - calculate the Ix^2, Iy^2 and Ix^Iy 
for (HarrisMatrix hm : harrisMatrixList) 
{ 
double Ix = hm.getXGradient () ; 
double Iy = hm.getYGradient () ; 


hm.setIxIy (Ix * Iy) ; 
hm.setXGradient (Ix*Ix) ; 
hm.setYGradient (Iy*Iy) ; 


} 

// 基于 高 斯 方法 ， 中 心 点 化 窗口 计算 一 阶 导 数 和 ， 关 键 一 步 SumIx2, SumIy2 and SumIxly, 高 斯 模糊 
calculateGaussianBlur (width, height) ; 

// 求 取 Harris Matrix 特征 值 

// 计算 角度 相应 值 R R= Det (H) - lambda * (Trace (H) ) ^2 
harrisResponse (width, height) ; 

// based on R, compute non-max suppression 
nonMaxValueSuppression (width, height) ; 

// match result to original image and highlight the key points 
int[] outPixels = matchToImage (width, height, src) ; 

// return result image 

SetRGB ( dest, 0, 0, width, height, outPixels ) ; 

return dest; 


上 述 代 码 中 ，GaussianDerivativeFilter 类 实现 了 对 图 像 X 方 向 和 Y 方 向 的 一 阶 导数 与 二 阶 导 数 计算 和 结果 输出 ， 默 认 的 高 斯 窗口 函数 为 3x 3 大 小 、a = 10。 选 择 不 同 的 参数 ， 可 实现 对 X 方 向 、Y 方 向 与 
XY 方 向 的 导数 计算 。 这 样 就 完成 了 第 一 步 的 功能 。 第 三 步 的 代码 实现 对 应 方法 为 calculateGaussianBlur () ， 其 目的 是 进一步 降低 噪声 影响 ， 实 现代 码 如 下 : 


int index = 0; 

int radius = (int) window radius; 

double[][] gw = get2DKernalData (radius, sigma) ; 

double sumxx = 0, sumyy = 0, sumxy = 0; 

for (int row-0; row<height; rowt+) { 

for (int col=0; col«width; col++) { 

for (int subrow =-radius; subrow<=radius; subrowt+) 


{ 


for (int subcol--radius; subcol<=radius; subcol++) 


{ 


int nrow = row + subrow; 
int ncol = col + subcol; 


if (nrow >= height || nrow < 0) 
nrow = 0; 
m (ncol >= width || ncol « 0) 
| ncol = 0; 


} 
int index2 = nrow * width + ncol; 
HarrisMatrix whm = harrisMatrixList.get (index2) ; 


sumxx += (gw[subrow + radius] [subcol + radius] * whm.getXGradient () ) ; 
sumyy += (gw[subrow + radius] [subcol + radius] * whm.getYGradient () ) ; 
sumxy += (gw[subrow + radius] [subcol + radius] * whm.getIxIy () ) ; 


} 
} 
index = row * width + col; 
HarrisMatrix hm = harrisMatrixList.get (index) ; 
hm.setXGradient (sumxx) ; 
hm.setYGradient (sumyy) ; 
hm.setIxIy (sumxy) ; 
// clean up for next loop 
sumxx = 0 
sumyy = 0; 
sumxy = 0 


> 
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private void harrisResponse (int width, int height) { 

int index = 0; 

for (int row-0; row<height; rowtt+) { 

for (int col=0; col<width; col++) { 
index = row * width + col; 
HarrisMatrix hm = harrisMatrixList.get (index) ; 
double c = hm.getIxIy () * hm.getIxIy () ; 
double ab = hm.getXGradient () * hm.getYGradient () ; 
double aplusb = hm.getXGradient () + hm.getYGradient () ; 
double response = (ab -c) - lambda * Math.pow (aplusb, 2) ; 
hm.setR (response) ; 


第 六 步 ， 使 用 3x 3 窗口 ， 实 现 简单 地 非 最 大 信号 压制 的 代码 如 下 : 


int index - 0; 
int radius = (int) window radius; 
for (int row-0; row«height; rowt+) { 
for (int col=0; col«width; col++) { 
index = row * width + col; 
HarrisMatrix hm = harrisMatrixList.get (index) ; 
double maxR = hm.getR () ; 
boolean isMaxR = true; 
for (int subrow =-radius; subrow<=radius; subrowt++) 


{ 


Ct ct 


for (int subcol--radius; subcol<=radius; subcol++) 


{ 


int nrow = row + subrow; 

int ncol = col + subcol; 

if (nrow >= height || nrow < 0) 
{ 


nrow = 0; 


} 


f (ncol >= width || ncol « 0) 


Eis. 


{ 
} 


int index2 = nrow * width + ncol; 

HarrisMatrix hmr = harrisMatrixList.get (index2) ; 
if (hmr.getR () > maxR) 

{ 


} 


ncol = 0; 


isMaxR = false; 
} 


f (isMaxR) 


a H- ~ 一 


hm.setMax (maxR) ; 


第 七 步 ， 最 终 在 图 像 上 显示 结果 数据 的 代码 如 下 : 


int[] inPixels = new int[width*height]; 
int[] outPixels = new int[width*height]; 
getRGB ( src, 0, 0, width, height, inPixels ) ; 
int index = 0; 
for (int row-0; row<height; rowt+) { 
int ta = 0, tr=0, tg=0, tb= 0; 
for (int col=0; col<width; col++) { 
index = row * width + col; 
ta (inPixels[index] >> 24) & Oxff; 
(inPixels [index] >> 16) & Oxff; 
Cinpixels [index] >> 8) & Oxff; 
tb = inPixels[index] & Oxf 
HarrisMatrix hm - harrisMatrixList.get (index) ; 
if (hm.getMax () > 0) 
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255; // make it as green for corner key pointers 
tb 3 
outPixels [index] = (ta << 24) | (tr << 16) | (tg << 8) | tb; 
} 
else 
{ 
outPixels[index] = (ta << 24) | (tr << 16) | (tg << 8) | tb; 


} 
} 


return outPixels; 


Harish Ee kM M2EHarrisCornerDetector, EK GrayFilterZé, EIBSESSEHUESZX EU, 3éHarrisMatrix£& Akit Harrisa. 3éGaussianDerivativeFilter 
则 是 关于 图 像 的 二 维 高 斯 一 阶 、 二 阶 导数 的 代码 实现 ， 高 斯 公式 相关 数学 知识 前 面 章节 已 经 介绍 过 ， 二 维 高 斯 的 偏 导数 可 以 参见 本 书 相 应 章节 的 源 代码 学 习 。 如 何 计 算 2x 2 和 矩阵 特征 值 同样 可 以 在 本 书 附录 A 
中 找到 。 


上 述 提 到 的 Harris 角 度 检测 相关 的 类 实现 代码 均 可 以 在 本 书 源 文件 中 的 13-06 找 到 ， 阅 读 与 运行 测试 Harris 角 度 检测 的 代码 实现 有 助 于 读者 进一步 理解 该 算法 ， 感 兴趣 的 读者 可 以 进一步 改写 与 优化 代码 
实现 。 此 外 ， 很 多 图 像 处 理 软件 都 会 用 标记 来 显示 关键 点 像素 ， 这 没有 在 代码 里 实现 ， 只 是 将 关键 点 像素 改 为 了 绿色 ， 所 以 读者 还 可 以 完成 自己 的 关键 点 像素 标记 显示 。 


13.7 SIFT 特 征 提取 


SIFT 算 法 的 历史 可 追溯 到 1999 年 ， 当 年 ，Lower 为 解决 Harris 角 度 检测 对 图 像 尺度 变化 敏感 的 问题 ， 提 出 了 局 部 特征 描述 子 算法 ，2004 年 在 他 人 的 基础 上 ，Lower 又 进一步 完善 了 该 算法 。SIFT (Scale 
Invariant Feature Transform) 算法 主要 是 解决 图 像 特征 在 尺度 空间 不 变性 的 问题 ， 通 过 寻找 图 像 上 特征 关键 点 建立 最 终 图 像 的 本 地 特征 描述 子 。SIFT 算 法 在 图 像 特征 匹配 、 搜 索 、 视 频 跟踪 等 领域 都 有 很 
重要 的 应 用 。SIFT 特 征 算 子 是 图 像 的 局 部 特征 ， 其 对 旋转 、 放 缩 、 亮 度 变化 保持 不 变 ， 对 视角 变化 、 仿 射 变换 、 噪 声 等 也 不 是 十 分 敏感 。 完 整 的 SIFT 算 法 是 由 一 系列 不 同 的 图 像 操 作 按 照 一 定 顺 序 组 成 的 ， 
最 终 得 到 特征 描述 子 。 这 其 中 ， 首 先 要 建立 尺度 空间 计算 高 斯 差分 (DOG) ， 然 后 在 此 基础 上 实现 极 值 查找 与 非 关 键 点 过 滤 ， 并 根据 尺度 参数 对 得 到 的 关键 点 ， 实 现 子 区 域 梯 度 与 角度 计算 ， 建 立方 向 直方 
， 最 后 才能 根据 关键 点 建立 关键 点 描述 子 


1. 尺 度 空间 建立 


尺度 空间 建立 ， 基 于 高 斯 核 国 数 a 取 值 的 不 同 来 实现 ， 其 中 最 重要 的 是 建立 高 斯 金字 塔 ， 对 每 一 层 基 于 不 同 的 a 值 构建 尺度 图 像 集合 ， 一 般 来 说 c 值 越 大 ， 图 像 越 模糊 。 然 后 基于 金字 塔 每 一 层 图 像 集 
合 ， 构 建 得 到 高 斯 差分 图 像 (DOG) ， 高 斯 差分 图 像 具 有 放 缩 不 变性 特征 ， 这 样 就 消除 了 图 像 放 缩 对 特征 提取 的 影响 。 关 于 建立 尺度 空间 建立 的 图 示 见 图 13-9。 
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计算 高 斯 差分 的 公式 为 : 


D(xw,y,o ) 
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(Gix,y, ko) - G(x,y,m)) * l(x,y) 
= L(x,y,ko) - L(x,y.o) 


其 中 [表示 高 斯 模糊 图 像 。 上 述 尺度 的 每 一 层 英文 有 个 很 专业 的 名 称 Octave， 中 文 的 翻译 简直 是 五 花 八 门 ， 所 以 在 这 里 还 是 决定 保留 其 英文 原 称 。 根 据 研究 表明 ， 当 a=1.6、 k = 2*8, 效果 近似 等 于 


拉 普 拉 斯 (LOG) 的 结果 。 根 据 上 述 输入 参数 ， 建 立 尺度 空间 还 必须 解决 的 另外 一 个 问题 是 尺度 层 数 问题 ，SIFT 算 法 论文 中 给 出 的 是 s+3 层 ， 其 中 Ks=2， 这 样 下 采样 得 到 下 一 个 Octave 是 取 当 前 Octave 尺 


度 参数 等 于 20 对 应 的 第 s 层 。 上 述 这 些 参数 及 采样 层 数 是 决定 尺度 空间 建立 的 必要 前 提 ， 根 据 这 些 参 数 完整 实现 尺度 空间 建立 与 高 斯 差分 (DOG) 的 代码 类 为 ScaleOctave.java， 其 中 关键 的 方法 


buildStub () 是 实现 建立 下 采样 对 应 的 层 图 像 数据 ，build () 方法 实现 图 像 每 个 Octave 尺 度 空间 的 建立 。 同 时 为 了 方便 操作 像素 数组 ， 定 义 了 一 个 数据 结构 类 Float2DArray.java， 用 来 存储 图 像 像 素数 据 
及 其 操作 结果 。 基 于 ScaleOctave 类 实现 SIFT 算 法 尺度 空间 建立 的 算法 代码 如 下 : 


// build scale space of octave 
Float2DArray next; 
for ( int i = 0; i < octaves.length; ++i ) 


{ 


octaves[ i ] = new ScaleOctave ( 
blurredData, 
sigma, 
sigma diff, 
kernel diff ) ; 
octaves[ i ].buildStub () ; 
next = new Float2DArray ( 
blurredData.width / 2 + blurredData.width % 2, 
blurredData.height / 2 + blurredData.height % 2 ) ; 
GaussianUtil.downsample ( octaves[ i ].getLevel ( 1) , next ) ; 
if ( blurredData.width » max size || blurredData.height » max size ) 
octaves[ i ] = null; i 
blurredData - next; 


其 中 GaussianUtiljava 是 工具 类 ， 提 供 了 高 斯 核 函 数 生成 、 归 一 化 、 像 素数 组 高 斯 卷 积 、 梯 度 计 算 等 常见 的 图 像 处 理 功 能 ， 相 信 这 些 对 本 书 读者 都 不 再 陌生 。 
2. 极 值 寻找 与 过 滤 


对 于 得 到 DOG 的 图 像 ， 在 每 个 Octave 的 每 个 尺度 (Scale) 上 ， 以 及 它 的 上 下 两 个 尺度 上 ， 使 用 3x 3 的 窗口 大 小 可 寻找 极 大 值 或 极 小 值 ， 如 图 13-10 所 示 。 
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这 里 ，X 表 示 中 心 像素 ， 圆 形 表示 周围 26 个 像素 点 ， 这 样 就 得 到 了 极 值 。 获 取 到 极 值 之 后 ， 因 为 是 在 离散 空间 采样 ， 并 不 能 保证 中 心 位 置 就 是 极 值 的 准确 位 置 ， 所 以 对 于 任意 一 个 上 述 空间 像素 点 
D (x, y, o) ， 算 法 作者 在 2002 年 提出 通过 在 三 维 空间 泰勒 级 数 展开 二 次 方程 插值 实现 极 大 值 定位 查找 ， 这 样 可 以 排除 非 极 值 关键 点 ， 规 定 在 任意 一 个 方向 上 移动 0.5 以 上 就 重新 计算 位 置 ， 如 果 成 功 得 到 
新 位 置 坐 标 D (x, y, o) 则 表示 成 功 得 到 极 值 位 置 。 该 公式 表示 为 : 
| | [| 
EU. dat 


| P 


778m 


Ax O = 
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其 中 X= (x, y, o) [表示 从 当前 采样 点 的 偏 移 。 


该 公式 的 对 采样 点 进行 二 阶 偏 导数 计算 ， 前 面 章节 中 已 经 讲 过 如 何 计算 图 像 一 阶 、 二 阶 偏 导数 ， 因 为 图 像 都 是 二 维 的， 这 里 唯一 不 同 的 是 要 在 三 维 空间 计算 ， 计 算得 到 二 阶 偏 导 数 本 质 上 是 一 个 三 维 空 
间 的 拉 普 拉 斯 算 子 ， 然 后 使 用 一 阶 偏 导 数 的 值 相 乘 ， 就 变 成 了 两 个 和 矩阵 相 乘 ， 得 到 的 结果 就 是 x、y、G 上 的 偏 移 量 ， 根 据 偏 移 量 带 入 计算 得 到 新 位 置 。 根 据 如 下 公式 : 


D(x 


如 果 计 算得 到 的 CO 值 小 于 0.025， 则 该 极 值 点 应 该 被 丢弃 ， 反 之 则 保留 。 对 保留 的 极 值 点 进行 Harris 和 矩阵 计 算 ， 如 果 值 大 于 闪 值 则 丢弃 ， 这 样 就 进一步 消除 了 边缘 对 关键 点 提取 的 
SIFT 算 法 关键 步骤 之 一 ， 有 助 于 提高 SIFT 算 法 精确 度 。 极 大 值 的 寻找 与 过 滤 也 被 封装 为 


下 ， 请 读者 对 照 原 理解 释 阅 读 ， 这 有 助 于 读者 更 好 地 理解 该 步骤 。 


Float2DArray[] d = octave.getDoGs () ; 
for (inti = d.length = 2; i >= 1; --i) 
{ 
int ia=i- 1; 
int ib =i+4+1; 
for ( int y = d[ i ].height = 2; y>=1; --y) 
{ 
int r= y * dl i ].width; 
int ra = r - d[ i ].width; 
int rb = r + d[ i ].width; 
X: for ( int x = d[ i ].width - 2; x >= 1; --x) 
{ 
int ic = i; 
int iac = ia; 
int ibc = ib; 
int yc = y; 
int rc = r; 
int rac = ra; 
int rbc = rb; 
int xc = x; 
int xa = xc - 1; 
int xb = xc + 


// check if d (x, 


Float e111 = d[ ic ].data[ r+ xc ]; 


y, i) is an extremum 


oat e000 = dl[ 


boolean isMax = e000 < e111; 
boolean isMin = e000 > e111; 


if ( ! ( isMax | 
float e100 = dl[ 
isMax &= e100 < el 


// do it pipeline-friendly ; ) 


iac ].data[ 


| isMin) ) 
iac ].data[ 


isMin &= e100 > e11] 


> 


if ( ! ( isMax | 


float e200 = d[ iac 
isMax &= e200 < e111 


| isMin) ) 


b 


( ! ( isMax 
loat e010 =d 
isMax &= e01 


isMin &= e200 > ell] 


| isMin ) ) 


iac ].data[ 


isMin &- e0] 


> 


if ( |! ( isMax 
float e110 = d 
isMax &= el] 


| isMin ) ) 


iac ].data[ 


> 


isMin & ell 

f£ ( ! ( isMax 
loat e210 =d 
isMax &= e2] 


| isMin ) ) 


iac ].data[ 


isMin &- e2] 


> 


if ( ! ( isMax 
float e020 =d 
isMax &= e020 < 


isMin ) ) 
iac ].data[ 


b 


isMin &= e020 > 
f ( ! ( isMax 


loat e120 = d 


isMin ) ) 
iac ].data[ 


isMin &= e120 > 


5 


if ( ! ( isMax 
float e220 =d 
isMax &= e220 < 


isMin ) ) 
iac ].data[ 


> 


isMin &= e220 > 

f ( ! ( isMax 
loat e001 = d 
isMax &= e001 


? 


| isMin) ) 


> 


< 
isMin &= e001 > 


if ( ! ( isMa 


> 


| isMin) ) 


? 


> 


| isMin) ) 


> 


> 


| isMin 22 


> 


b 


| isMin ) ) 


2 


> 


| isMin) ) 


b 


> 


| isMin) ) 


> 


» 


| isMin) ) 


> 


isMax &= e201 < 
isMin &= e201 > 
if ( ! ( isMax 
Float e011 = d 
isMax &= e0 < 
isMin &= e0 > 
if ( | ( isMax 
Float e211 = d 
isMax &= e2 < 
isMin &= e2 > 
if ( | ( isMax 
Float e021 = d 
isMax &= e021 < 
isMin &= e021 > 
if ( | ( isMax 
Float e121 = d 
isMax &= e121 < 
isMin &= e121 > 
if ( ! ( isMax 
float e221 = d 
isMax &= e221 < 
isMin &= e221 > 
if ( ! ( isMax 


| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
x | 
loat e101 = d[ 
, ej 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 
e 
e 
| 
[ 


| isMin) ) 


ibc ].data[ 


> 


h H= H- H- Hh H- 


isMin ) ) 
ibc ].data[ 


> 


loat e202 = d[ 


Max &= e202 < e] 


sMax &= e002 < e 
sMin &= e002 > e111 
f ( ! ( isMax | | 
loat e102 = dl[ 
isMax &= e102 < el 
isMin &= e102 > e111; 
if ( ! ( isMax || 


isMin ) ) 
ibc ].data[ 


> 


f (! ( isMex | 
loat e012 = dl[ 


is 
isMin &= e202 > e111; 
if 


isMax &= e012 < el] 


isMin ) ) 
ibc ].data[ 


> 


rac + xa J; 


continue; 
rac + xc J; 


continue; 


].data[ rac + xb ]; 


continue; 
rc + xa ]; 


continue; 
re + xe ls 


continue; 
re + xb J; 


continue; 
roc + xa J; 


continue; 
roc + xc J; 


continue; 
roc + xb J; 


continue; 


ic ].data[ rac + xa ]; 


continue; 


ic ].data[ rac + xc ]; 


continue; 


ic ].data[ rac + xb ]; 


continue; 


ic ].data[ rc + xa ]; 


continue; 


ic ].data[ rc * xb ]; 


continue; 


ic ].data[ rbc + xa ]; 


continue; 


ic ].data[ rbc + xc ]; 


continue; 


ic ].data[ rbc + xb ]; 


continue; 
rac * xa ]; 


continue; 
rac * xc ]; 


continue; 
rac * xb ]; 


continue; 
rc + xa ]; 


i= 
m2 


响 。 该 步骤 也 是 


个 单独 类 ， 即 OctaveKeyPointersDetector.java。 其 中 detectCandidates () 方法 实现 上 述 全 部 功能 ， 代 码 实现 如 


isMin &= e012 > e111; 
if ( ! ( isMax || isMin ) ) continue; 
Float e112 = d[ ibc ].data[ rc + xc ]; 
isMax &= e112 < e111; 
isMin &= e112 > e111; 
if ( ! ( isMax || isMin ) ) continue; 
float e212 = d[ ibc ].data[ rc + xb ]; 
isMax &= e212 < elll; 
isMin &= e212 > e111; 
if ( ! ( isMax || isMin ) ) continue; 
float e022 = d[ ibc ].data[ rbc + xa ]; 
isMax &= e022 < e111; 
isMin & e022 > e111; 
if ( ! ( isMax || isMin ) ) continue; 
float e122 = d[ ibc ].data[ rbc + xc ]; 
isMax &= e122 < e111; 
isMin & e122 > e111; 
if ( ! ( isMax || isMin ) ) continue; 
float e222 = d[ ibc ].data[ rbc + xb ]; 
isMax &= e222 < ell1l1; 
isMin &= e222 > e111; 
if ( ! ( isMax || isMin ) ) continue; 
// so it is an extremum, try to localize it with subpixel 
// accuracy, if it has to be moved for more than 0.5 in at 
// least one direction, try it again there but maximally 5 
// times 
boolean isLocalized = false; 
boolean isLocalizable = true; 
Float dx; 
float dy; 
Float di; 
Float dxx; 
Float dyy; 
Float dii; 
Float dxy; 
Float dxi; 
Float dyi; 
Float ox; 
float oy; 
Float oi; 
Float od = Float.MAX VALUE; // offset square distance 
Float fx = 0; E 
float fy = 0; 
float fi = 0; 
int t = 5; // maximal number of re-localizations 
do 
{ 
sst 
// derive at (x, y, i) by center of difference 
dx = ( e211 - e011 ) / 2.0f; 
dy = ( e121 - e101 ) / 2.0f; 
di = ( e112 = e110 ) / 2.0f; 
// create hessian at (x, y, i) by laplace 
float e111 2 = 2.0f * e111; 
dxx = e011 - elll 2 + e211; 
dyy = e101 = elll 2 + e121; 
dii = e110 - e111 2 + e112; 
dxy = ( e221 - e021 - e201 + e001 ) / 4.0f; 
dxi = ( e212 - e012 - e210 + e010 / 4.0f; 
dyi = ( e122 - e102 - e120 + e100 ) / 4.0f; 
// invert hessian 
Matrix H = new Matrix ( new double[] []{ 
( ( double) dxx, ( double ) dxy, ( double ) dxi }, 
{ ( double) dxy, ( double ) dyy, ( double ) dyi }, 
( ( double) dxi, ( double ) dyi, ( double ) dii } }, 
Matrix H inv; 
try 
{ 
H inv = H.inverse () ; 
catch ( RuntimeException e ) 


{ 


continue X; 


} 
double[][] h inv = H inv.getArray () ; 
/ 


da Sos 


&& ode < od ) 


|| fi» d.length - 1 ) 


/ estimate the location of zero crossing being the offset of the extremum 
ox = -( float ) h inv[ 0 ][ 0 ] * dx - float ) h inv[0][ 1] * dy - ( float ) h inv[ 
oy = - ( float ) h inv[ 1][ 0] * dx - ( float ) h inv[ 1 ]I ] * dy - ( float ) h inv[ 
oi = - ( float ) h inv[ 2 ][ 0 ] * dx — ( float ) h inv[ 2 ][ ] * dy — ( float ) h inv] 
float odc = ox * ox + oy * oy + oi * oi; 
if ( ode < 2.0f ) 

{ 
if ( ( Math.abs ( ox ) > 0.5 || Math.abs ( oy ) > 0.5 || Math.abs ( oi ) > 0.5) 
{ 
od = odc; 
xc = ( int ) Math.round ( ( float ) xc + ox ) ; 
ye = ( int ) Math.round ( ( float ) yc + oy ) ; 
ic = ( int ) Math.round ( ( float ) ic + oi ) ; 
if ( xc <1 || ye <1 || ic <1 || xc > d[ 0 ].width - 2 || yc > d[ 0 ].height - 2 || ic > d.length - 2 ) 
isLocalizable = false; 
else 
{ 
xa = xc - 1; 
xb = xc + 1; 
rc = yc * d[ ic ].width; 
rac = rc - d[ ic ].width; 
roc = rc + d[ ic ].width; 
jac = ic = 1; 
ibe = ic + 1; 
e000 = d[ iac ].data[ rac + xa ]; 
e100 = d[ iac ].data[ rac + xc ]; 
e200 = d[ iac ].data[ rac + xb ]; 
e010 = d[ iac ].data[ rc + xa ]; 
e110 d[ iac ].data[ rc + xc ]; 
e210 = d[ iac ].data[ rc + xb ]; 
e020 = d[ iac ].data[ rbc + xa ]; 
e120 = d[ iac ].data[ rbc + xc ]; 
e220 = d[ iac ].data[ rbc + xb ]; 
e001 = d[ ic ].data[ rac + xa ]; 
e101 = d[ ic ].data[ rac + xc ]; 
e201 = d[ ic ].data[ rac + xb ]; 
e011 = d[ ic ].data[ rc + xa ]; 
e111 = d[ ic ].data[ rc + xc ]; 
e211 = d[ ic ].data[ rc + xb ]; 
e021 = d[ ic ].data[ rbc + xa ]; 
e121 = d[ ic ].data[ rbe + xc ]; 
e221 = d[ ic ].data[ rbe + xb ]; 
e002 = d[ ibc ].data[ rac + xa ]; 
e102 = d[ ibc ].data[ rac + xc ]; 
e202 = d[ ibc ].data[ rac + xb ]; 
e012 = d[ ibc ].data[ rc + xa ]; 
e112 = d[ ibc ].data[ rc + xc ]; 
e212 d[ ibc ].data[ rc + xb ]; 
e022 = d[ ibc ].data[ rbc + xa ]; 
e122 = d[ ibc ].data[ rbc + xc ]; 
e222 = d[ ibc ].data[ rbc + xb ]; 
} 
} 
else 
{ 
fx = ( float ) xc + ox; 
fy = ( float ) yc + oy; 
fi = ( float ) ic + oi; 
if ( fx <0 || fy < 0 || f1«0 || fx»d[O ].width - 1 || fy > d[ 0 ].height - 1 
isLocalizable - false; 
else 
isLocalized = true; 


else isLocalizable - false; 


while ( ! isLocalized && isLocalizable && t >= 0 ) ; 
// reject detections that could not be localized properly 


if ( ! isLocalized ) 


{ 


continue; 


/ reject detections with very low contrast 

f ( Math.abs ( e111 + 0.5£ * ( dx * ox + dy * oy + di * oi ) ) < CONTRAST THESHOLD ) continue; 
/ reject edge responses by Harris i 

loat det = dxx * dyy - dxy * dxy; 

oat trace = dxx + dyy; 

if ( trace * trace / det » MAX CURVATURE RATIO ) continue; 

candidates.addElement ( new float[]{ fx, fy, fi }); 


y PAN |o 


上 述 代码 可 以 分 为 三 个 部 分 ， 第 一 部 分 是 实现 中 心 点 周围 26 个 像素 点 比较 ， 第 二 部 分 是 实现 在 三 维 空间 的 偏 移 计算 与 极 大 值 定位 ， 最 后 一 部 分 实现 极 大 值 过 滤 ， 其 中 三 维 空间 是 指 任意 一 个 像素 的 位 置 
都 是 由 (x, y, o) 组 成 的 。 


3. 天 键 点 方向 指派 


经 过 上 面 两 步 以 后 得 到 的 关键 点 具备 了 放 缩 不 变性 的 特征 ， 因 此 ， 关 键 点 方向 指派 主要 实现 关键 点 的 旋转 不 变性 。 实 现 方向 指派 是 通过 对 关键 点 周围 贺 形 像素 子 区 域内 的 像素 计算 梯度 与 角度 ， 并 通过 
角度 直方 图 来 寻找 梯度 变化 最 大 的 像素 。 建 立 直方 图 时 ， 以 每 10 度 为 一 个 BIN 建立 直方 图 ， 这 样 即使 得 到 最 大 直方 图 ， 仍 然 无 法 确切 知道 角度 具体 的 大 小 值 。 根 据 抛 物 线 原理 ， 如 果 知 道 它 左右 值 ， 就 可 以 
通过 插值 得 到 精确 的 角度 最 大 值 ， 作 为 该 关键 点 的 角度 值 ， 这 样 就 完成 了 关键 点 方向 指派 。 


同时 根据 SIFT 算 法 作者 的 论文 [1] 可知， 还 应 该 对 大 于 最 大 值 80% 的 BIN 做 同样 的 计算 ， 以 作为 关键 点 方向 ， 统 计 证 明 约 有 15% 的 关键 点 有 多 个 方向 ， 这 样 做 的 好 处 是 提供 SIFT 算 法 匹配 与 识别 率 ， 感 兴 
趣 的 读者 可 以 自己 完成 该 部 分 的 代码 。 


其 中 梯度 计算 是 取 X 方 向 与 Y 方 向 的 梯度 值 的 平方 根 ， 公 式 表示 为 如 下 
角度 计算 公式 为 : 

Nx.) = lan” (CEGx,y +1) — Z(x,y — 1) )ZCEQx 4+ 1,y) — E(x -l1,y))) 
梯度 计算 的 代码 实现 被 放 在 了 工具 类 GaussianUtiljava 中 。 完 整 的 关键 点 方向 指派 代码 实现 大 致 步 又 如 下 : 


1) 输入 关键 点 信息 ， 初 始 化 高 斯 核 模板 。 


// get current layer sigma of the Octave 
float octave sigma = scaleOctave.sigma[ 0 ] * ( float ) Math.pow ( 2.0£, c[ 2 ]) ; 
// create a circular gaussian window with sigma 1.5 times that of the key point 
Float2DArray gaussianMask - 
GaussianUtil.create gaussian kernel 2D offset ( 
octave sigma * 1.5f 


c[0]- ( float ) Math.floor (c[0]), M X 
c[1]- ( float ) Math.floor ( c[ 11), //y 
false ) ; 


2) 计算 当前 层 图 像 每 个 像素 数 的 梯度 与 角度 ， 根 据 高 斯 模板 大 小 得 到 关键 点 周围 像素 梯度 与 角度 。 


// get the gradients in a region around the key points location 

Float2DArray[] src = GaussianUtil.createGradients (scaleOctave.getLevel (Math.round (c[ 2 ] ) ) ) ; 
Float2DArray[] gradientROI = new Float2DArray[ 2 ]; 
gradientROI[ 0 ] = new Float2DArray ( gaussianMask.width, gaussianMask.width ) ; 
gradientROI[ 1 ] = new Float2DArray ( gaussianMask.width, gaussianMask.width ) ; 
int half size - gaussianMask.width / 2; 

int p = gaussianMask.width * gaussianMask.width - 1; 


for ( int yi = gaussianMask.width - 1; yi >= 0; --yi ) 

{ 
int ra y = src[ 0 ].width * Math.max ( 0, Math.min ( src[ 0 ].height - 1, ( int ) c[ 1] + yi - half size) ) ; 
int ra x = ra y+ Math.min( ( int) c[ 0], src[ 0 ].width - 1) ; 
for ( int xi = gaussianMask.width - 1; xi >= 0; --xi ) 


{ 


int pt = Math.max ( ra y, Math.min ( ra y + src[ 0 l.width - 2, ra x + xi - half size ) ) ; 
gradientROI[ O ].data[ p ] src[ O ].data[ pt ] 
gradientROI[ 1 ].data[ p ] src[ 1 ].data[ pt ] 
CP 


2 
5 


3) 对 关键 点 周围 像素 梯度 完成 高 斯 权重 计算 。 


// calculate weighted gradient of each pixels around key points 
for ( int i = 0 i < gradientROI[ 0 J.data.lengthi ++i ) 
{ 


} 


gradientROI[ 0 ].data[ i ] *= gaussianMask.data[ i ]; 


4) 建立 角度 直方 图 ， 获 取 最 大 角度 。 


// build an orientation histogram of the sub region 
for ( int i = 0; i < gradientROI[ 0 ].data.length; ++i ) 
{ 


int bin = Math.max ( 0, ( int) ( ( gradientROI[ 1 ].data[ i] + Math.PI ) / ORIENTATION BIN SIZE ) ) ; 
histogram bins[ bin ] += gradientROI[ 0 ].data[ i ]; 


} 
// find the max value 

int max i = 0; 

for ( int i = 0; i < ORIENTATION BINS; ++i ) 
{ 


} 


if ( histogram bins[ i ] > histogram bins[ max i | ) max i = i; 


5) 插值 计算 得 到 最 终 精确 角度 值 。 


float e0 = histogram bins[ ( max i + ORIENTATION BINS - 1) % ORIENTATION BINS ]; 
float el = histogram bins[ max i ]; 
float e2 = histogram bins[ ( max i + 1) % ORIENTATION BINS ]; 


float offset = ( e0 - e2 ) /2.0£/ ( e0 - 2.0f * el + e2 ) ; 
oat orientation = ( ( float ) max i + offset ) * ORIENTATION BIN SIZE - ( float ) Math.PI; 


i 


4. 关 键 点 描述 子 生成 


对 得 到 的 每 个 关键 点 ， 取 关键 点 在 中 心 位 置 的 16x16 像 素 窗口 ， 计 算 窗口 内 每 个 像素 的 角度 与 梯度 ， 并 且 对 得 到 的 梯度 值 乘 以 高 斯 权重 。 将 16x16 的 像素 区 域 划分 为 4x4 的 16 个 子 区 域 ， 每 个 区 域 16 个 
像素 ， 扫 描 子 区 域 的 每 个 像素 ， 对 每 个 子 区 域 建 立方 向 直方 图 ， 方 向 在 0~ 360 度 之 间 ， 且 分 为 8 个 等 份 ， 每 个 等 份 方向 上 的 值 是 各 个 子 区 域 梯 度 值 的 累加 ， 这 样 就 得 到 了 4x4x8 = 128 个 关键 点 描述 子 。 对 全 
部 关键 点 完成 此 操作 ， 即 得 到 图 像 SIFT 特 征 提取 结果 。 操 作 图 如 图 13-11 所 示 。 
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关键 点 窗口 16x 16 生成 的 128 个 关键 点 描述 子 


图 13-11 关键 点 描述 子 生成 


采样 生成 16x16 关 键 点 窗口 的 代码 如 下 : 


// sample the region around the key points location 


for ( int y = FEATURE DESCRIPTOR WIDTH - 1; y >= 0; --y) 
{ 
float ys = 
( ( float) y - 2.0£ * ( float ) FEATURE DESCRIPTOR SIZE + 0.5f ) * octave sigma; //! < scale y around 0, 0 
for ( int x = FEATURE DESCRIPTOR WIDTH - 1; x >= 0; --x ) 
{ 
float xs = 


( ( float) x - 2.0f * ( float ) FEATURE DESCRIPTOR SIZE + 0.5f ) * octave sigma; //! < scale x around 0, 0 
oat yr = cos o * ys + sino * xs; //! < rotate y around 0, 0 
float xr = cos o * xs - sino * ys; //! < rotate x around 0, 0 
// translate ys to sample y position in the gradient image 
int yg = GaussianUtil.flipInRange ( 
( int) ( Math.round ( yr + c[ 11] ) )， 
gradients[ 0 ].height ) ; 
// translate xs to sample x position in the gradient image 
int xg = GaussianUtil.flipInRange ( 
(int) ( Math.round( xr + c[ 0] ) ), 
gradients[ O ].width ) ; 
// get the samples 
int region p - FEATURE DESCRIPTOR WIDTH * y - x; 
int gradient p = gradients[ 0 ].width * yg + xg; 
// weigh the gradients 


£] 


region[ 0 ].data[ region p ] = gradients[ 0 ].data[ gradient p ] * descriptorMask[ y ][ x ]; 
// rotate the gradients orientation it with respect to the features orientation 
region[ 1 ].data[ region p ] = gradients[ 1 ].data[ gradient p ] - orientation; 


基于 窗口 生成 角度 直方 图 的 代码 如 下 : 


// 建立 4x4 的 16 个 直方 图 ， 每 个 直方 图 有 8 个 方向 


float[][][] hist = new float[ FEATURE DESCRIPTOR SIZE ][ FEATURE DESCRIPTOR SIZE ][ FEATURE DESCRIPTOR ORIENTATION BINS ]; 
// build the orientation histograms of 4x4 sub region 
for ( int y = FEATURE DESCRIPTOR SIZE - 1; y >= 0; --y) 


{ 


int yp = FEATURE DESCRIPTOR SIZE * 16 * y; 
for ( int x= FEATURE DESCRIPTOR SIZE - 1; x >= 0; --x ) 
{ 


int xp = 4 * x; 
for ( int ysr = 3; ysr >= 0; --ysr ) 
{ 


int ysrp = 4 * FEATURE DESCRIPTOR SIZE 
for ( int xsr = 3; xsr >= 0; --xsr ) 


{ 


* ysr; 


// make it scope in 0 ~ 2PI 
float bin location = ( region[ 1 ].data[ yp + xp + ysrp + xsr ] + ( float ) Math.PI ) / ( float ) FEATURE DESCRIPTOR ORIENTATION BIN SIZE; 
// calculate rate for line nearest interpolation iB 7 a 

int bin b = ( int) ( bin location ) ; 

int bin t = bin b + 1; 加 

float d = bin location - ( float ) bin b; 

// make it value in scope[0, 7], bad way! ! , 

// can check use if (bin t > 7) bin b = 6, bin t = 7, ugly code! | 

bin b= (binb-42* FEATURE DESCRIPTOR ORIENTATION BINS ) % FEATURE DESCRIPTOR ORIENTATION BINS; 

bin t = ( bin t + 2 * FEATURE DESCRIPTOR ORIENTATION BINS ) % FEATURE DESCRIPTOR ORIENTATION BINS; 

// 高 斯 权重 梯度 

float t = region[ 0 ].data[ yp + xp + ysrp + xsr ]; 

// 基于 权重 精准 累加 

hist[ y J[ x ][ bin b ] += 
hist[ y J[ x ][ bin t ] += 


* ox 14-4 
* d; 


ct ct 


基于 角度 直方 图 结果 ， 生 成 关键 点 128 描 述 子 的 代码 如 下 : 


// define 128 descriptor 
float[] desc = new float[ FEATURE DESCRIPTOR SIZE * FEATURE DESCRIPTOR SIZE * FEATURE DESCRIPTOR ORIENTATION BINS ]; 
// build the descriptor array, and find max value 
float max bin val = 0; 

int a= OF  — 


for ( int y = FEATURE DESCRIPTOR SIZE - 1; y »- 0; --y ) 
{ 


for ( int x = FEATURE DESCRIPTOR SIZE - 1; x >= 0; --x ) 
{ 
for ( int b = FEATURE DESCRIPTOR ORIENTATION BINS - 1; b >= 0; --b) 
{ 
desc| i ] = hist[ y II x ][ b ]; 
if ( desc[ i ] > max bin val ) max bin val = desc[ i ]; 
++i; 


完整 的 关键 点 描述 子 生成 代码 参见 SIFTFeatureDetector 类 中 的 createDescriptor () 方法 ， 其 中 还 包括 了 最 后 一 步 对 得 到 的 描述 子 进行 归 一 化 。 
5.SIFT 算 法 代码 说 明 


完整 的 SIFT 算 法 代码 实现 参见 本 书 源 文件 的 包 com.book.chapter.thirteen.sift 中 所 有 代码 类 ，SIFT 算 法 实现 是 本 书 前 面 所 学 知识 的 综合 运用 ， 涉 及 图 像 卷 积 、 高 斯 模糊 、 图 像 像 素 归 一 化 处 理 、 计 算 图 
像 像素 梯度 与 角度 、 图 像 高 斯 金字 塔 建立 、 下 采样 、Harris 特 征 提取 等 。 其 中 本 人 认为 影响 SIFT 特 征 提取 最 关键 的 在 于 第 二 步 ， 即 极 值 寻找 与 定位 、 过 滤 ， 其 中 的 插值 方法 是 图 像 二 维 插 值 的 延伸 。 再 次 强 
调 一 下 源 代码 也 是 本 书 的 一 部 分 ， 阅 读 与 运行 本 书 中 源 代 码 有 助 于 读者 加 深 对 所 学 知识 的 理解 ， 跨 越 图 像 处理 理 论 与 实践 脱节 的 鸿沟 ， 更 好 地 理解 所 学 知识 。 


[1] David G. Lowe - "Distinctive Image Features from Scale-Invatiant Keypoints" , January 5,2004。 


13.8 小 结 


本 章 介 绍 了 图 像 特 征 提 取 带 见 算法 ， 从 最 简单 的 图 像 颜 色 特 征 提取 开始 ， 过 渡 到 基于 灰 度 共 生 和 矩 阵 的 (GLCM) 纹理 提取 ， 然 后 介绍 了 图 像 中 最 重要 的 变换 一 一 霍 夫 变换 ， 并 详细 介绍 了 基于 霍 夫 变 换 
检测 直线 与 圆 的 原理 和 代码 实现 步骤 。 此 外 ， 还 基于 前 面 学 习 到 图 像 卷 积 知识 ， 介 绍 了 图 像 高 斯 金字 塔 提取 过 程 ， 以 及 提取 图 像 中 边缘 角度 的 算法 ， 即 Harris 角 度 特 征 检测 算法 。 最 后 在 本 书 前 面 所 学 的 知 
识 基础 上 ， 着 重 介绍 图 像 SIFT 特 征 提取 这 一 重要 算法 ， 通 过 详细 剖析 实现 步 又 与 代码 实现 ， 帮 助 读者 厘清 SIFT 算 法 如 何 实现 尺度 与 旋转 不 变性 特征 提取 ， 建 立 最 终 的 SIFT 特 征 描述 子 的 整个 过 程 。 


在 学 习 图 像 处 理 知 识 的 同时 ， 本 章 也 涉及 一 些 简 单数 学 概念 ， 比 如 和 矩 阵 的 特征 向 量 、 和 矩 阵 反 转 、 一 些 简单 的 高 斯 核 生成 、 归 一 化 处 理 等 ， 这 些 在 代码 中 均 有 体现 ， 相 信 读 者 只 要 查阅 相关 知识 ， 稍 作 了 
解 ， 对 照 代码 实现 ， 不 难 掌握 。 在 这 里 还 想 再 次 说 明 ， 图 像 特 征 提取 涉及 较 多 的 数学 知识 ， 想 要 深入 阅读 与 研究 ， 具 备 这 些 基本 的 数学 知识 是 必 不 可 少 的 条 件 之 一 。 本 章 内 容 只 是 管 中 寅 豹 ， 希 望 帮 读 者 打 
开 图 像 特征 提取 这 扇 门 。 


B14 mAH: 照片 转 油画 算法 


从 第 1~13 章 ,介绍 了 图 像 处 理 各 种 知识 ， 本 章 将 介绍 一 个 当下 十 分 流行 的 照片 转手 绘 油画 算法 。 想 象 一 下 ， 当 画家 以 照片 为 模板 开始 创造 一 幅 对 应 的 油画 了 时， 首先 画 出 来 的 会 是 什么 ? 肯定 是 轮廓 ， 然 
后 才 是 细节 ， 一 笔 一 笔 地 画 下 去 ， 最 终 得 到 完整 的 油画 。 而 我 们 要 做 的 就 是 让 程序 来 模仿 这 一 过 程 ， 其 中 最 关键 就 是 笔画 (Stroke) 生成 。 


该 算法 的 基本 原理 基于 一 篇 学 术 论 文 (Enhancement of Moment Based Painterly Rendering Using Connected Components) ， 主 要 是 通过 计算 像素 的 Moments 得 到 笔画 区 域 ， 然 后 通过 灰 度 图 
像 的 抖动 算法 实现 笔画 位 置 采样 ， 在 得 到 位 置 以 后 通过 计算 区 域 Moments 得 到 笔画 的 中 心 位 置 、 宽 、 高 、 角 度 等 参数 ， 形 成 每 个 笔画 ， 根 据 笔 画 大 小 ， 从 最 大 笔画 开始 绘制 ， 直 到 所 有 笔画 绘制 完成 就 得 到 
了 完整 的 油画 图 像 。 上 述 过 程 每 步 都 会 涉及 前 面 章节 中 已 经 学 到 的 一 些 图 像 处 理 知识 ， 所 以 说 本 章 可 帮助 大 家 加 深 对 前 面 所 学 知识 的 理解 与 实战 运用 。 


14.1 EEKE 


实现 图 像 转手 绘 油画 的 第 一 步 就 是 要 对 输入 图 像 进行 画笔 区 域 (Stroke Area) 处 理 ， 该 步骤 的 主要 原理 是 根据 指定 窗口 大 小 ， 计 算 窗口 内 像素 的 Moments 值 作为 该 窗口 内 中 心 像素 点 的 值 ， 这 里 取 


Moment 的 零 阶层 值 ， 图 像 Moments 的 计算 公式 如 下 : 


im A .y ) 


因为 输入 的 是 彩色 RGB 图 像 ， 所 以 为 了 得 到 每 个 像素 点 只 有 一 个 值 的 灰 度 像素 点 ， 要 先 计 算 每 个 像素 点 RGB 三 通道 值 与 中 心 像 素 点 RGB 之 间 的 欧 几 里 得 距离 ， 然 后 根据 输入 参数 d02 处 理 得 到 0~1 之 间 的 比 
值 。 完 整 的 画笔 区 域 生成 大 致 分 为 如 下 几 步 : 


1) 初始 化 输入 人 参数， 默认 窗口 大 小 size = 10、d02 = 150x150, 

2) 循环 处 理 每 个 像素 

a) 计算 窗口 内 像素 的 Moments 值 。 

b) 对 Moments 值 结果 除 以 窗口 大 小 ， 然 后 乘 以 255， 得 到 0~255 之 间 的 灰 度 值 。 
C) 作为 该 像素 点 的 新 值 写 到 输出 像素 数组 中 。 


3) 将 输出 的 像素 数组 赋值 到 输出 图 像 中 ， 返 回 笔画 区 域 图 像 。 


完整 的 实现 类 代码 StrokeAreaFilterjava 可 以 参见 源 文 件 中 第 14 章 相关 部 分 ， 核 心 部 分 代码 如 下 所 示 : 


获取 像素 ， 初 始 化 窗口 大 小 的 代码 片段 如 下 : 


] inPixels = new int[width*height]; 


getRGB ( src, 0, 0, width, height, inPixels ) ; 


int[ 

int[] outPixels = new int 
int index = 0, index2 = 0; 
int semiRow = (int) (siz 
int semiCol = (int) (siz 
int newX, newY; 


// initialize the color RG 


[width*height] ; 


e/2) ; 
e/2) ; 


] rgb = new int[3]; 


int [ 
int[] rgb2 = new int[3]; 
for (int i=0; 


} 


: 实现 Moment 计 算得 到 每 个 像素 计算 结果 的 代码 如 下 : 


index = row * width + col 


i«rgb.length; i++) { 
rgb[i] = rgb2[i] = 0; 


^ 


> 


ta = (inPixels[index] >> 24) & Oxff; 

rgb[0] = (inPixels[index] >> 16) & Oxff; 

rgb[1] = (inPixels[index] >> 8) & Oxff; 

rgb[2] = inPixels[index] & Oxff; 

/* adjust region to fit in source image */ 

// color difference and moment Image 

double moment = 0.0d; 

for (int subRow = -semiRow; subRow <= semiRow; 
for (int subCol = -semiCol; 


newY = row + subRow; 


newY = 0; 


newX = 0; 


if (newY < 0) { 


if (newX < 0) { 


newX = col + subCol; 


if (newY >= height) { 
newY — height-1; 


if (newX >= width) | 


newX — width - 1; 


index2 - newY * 
rgb2 [0] 


width + newX; 


(inPixels[index2] »» 16) 


(inPixels[index2] >> 8) & Oxf! 


rgb2 [1] 
rgb2 [2] 


inPixels[index2] & Oxff; // bl 


moment += colorDiff (rgb, rgb2) ; 


} 


// calculate the output pixel value. 


int outPixelValue = clamp ( (int) 


outP 


B array with zerohttp://www.hzcourse.com/resource/readi 


subRow--) { 
subCol <= semiCol; subCol++) { 


ff; // red 


t; // green 
ue 


(255.0d * moment / (size*size) ) ) ; 


Book?path-/openresources/teach ebook/uncompressed/15509/0E 


ixels[index] = (ta << 24) | (outPixelValue << 16) | (outPixelValue << 8) | outPixelValue; 


- 计算 颜色 距离 的 代码 如 下 : 


publ 
{ 
/ 


ic static double colorDiff (int[] rgbl, int[] rgb2) 


/ i= td/d0) ^2) ^2 


double d2, r2; 
d2 = colorDistance (rgbl, rgb2) ; 


L 


r 


if (d2 >= d02) 


return 0.0; 
2 = d2 / düz; 


É 


eturn ( (1.0d - r2) 


* (120d = 22) )3 


} 
public static double colorDistance (int[] rgbl, 


{ 


int dr, dg, db; 

dr = rgb1[0] - rgb2[0] 
dg = rgbl[1] = rgb2[1] 
db = rgb1[2] - rgb2[2] 


^ 


return dr * dr + dg * dg + db * db; 


int[] rgb2) 


-— 


BPS/Text/... 


测试 与 运行 该 代码 时 ， 可 以 运用 本 章 提供 的 MainUljava 类 ， 该 用 户 界 面 提供 了 选择 图 像 与 处 理 图 像 两 个 功能 ， 其 中 【Paint】 按 钮 将 触发 照片 转 油画 功能 。 具 体 如 何 运行 测试 StrokeAreaFilter 类 ,可 
以 参照 本 书 第 3 章 中 测试 类 的 例子 ， 这 里 就 不 再 玖 述 。 


14.2 


从 画笔 区 域 图 像 可 以 得 到 那些 需要 着 重 绘制 的 区 域 ， 可 是 每 个 细节 需要 绘制 多 少 笔画 呢 7 这 样 就 转换 为 采样 问题 了 ， 这 里 的 采样 算法 采用 了 弗 洛 伊 德 -斯 坦 德 伯 格 抖动 算法 ， 该 算法 是 将 灰 度 图 像 转 为 
白 图 像 时 的 经 典 采样 算法 ， 基 于 错误 扩散 完成 。 本 书 的 第 10 章 对 该 算法 有 详细 描述 与 代码 实现 。 注 意 ， 为 了 更 好 地 体现 采样 的 随机 性 ， 这 里 增加 了 错误 扩散 的 随机 性 。 在 类 strokeGenerator 的 


Sealed a 


strokePosition 方 法 中 实现 画笔 区 域 拌 动 采样 的 代码 如 下 : 
int x, y; 
Float error, value; 


Ea (float) ( (s- 


floa 


E 


nitialization the buf 


fer rows 


floa 


t[] currow = new floa 


t [width]; 


floa 


t[] nxtrow = new floa 


t [width]; 


int[] posArea = new int[width * height]; 
for (x20; x < width; x++) 
{ 
nxtrow[x] = Math.max 
} 
// start to dither algorithm 
for (int row-1; row«height-1; rowt+) 


{ 


/* next line becomes 


current line */ 


swap (currow, nxtrow) ; 


/* copies next line 
nxtrow[0] = Math.max 


nxtrow[x] = 1.0 


} 


/* spread error */ 


to local buffer */ 
(1.0£/ (ax (float) (Math.pow (getGrayPixels (inpixels, row * width) , p) ) 41), 0. 
for (x21; x < width; x++) { 
f/ (a* (float) (Math.pow (getGrayPixels (inpixels, 


for (x =1; x < width-1; x++) { 
value = currow[x] > 1.0£ ? 1.0f : 0. 
error = currow[x] - value; 


int gray = value > 0.0? 0: 255; 


posArea[row * width + x] = (255 << 24) 


1) /Math.pow (255.0, p)) ; 
Random rand = new Random () ; 


(1.0£/ (ax (float) (Math.pow (getGrayPixels (inpixels, x), p) ) +1), 0 


(row * width + x) ) , 


| (gray << 16) | (gray << 8) | gray; 


DE) 5 


php $14 


5f 


E 


TWN 


switch (rand.nextInt (100) 


case 0: 
nxtrow[x + 1] += 
nxtrow[x - 1] += 
nxtrow[x] += 
currow[x + 1] += 
break; 

case 1: 
nxtrow[x + 1] += 
nxtrow[x - 1] += 
nxtrow[x] += 
currow[x + 1] += 
break; 

case 2: 
nxtrow[x + 1] += 
nxtrow[x - 1] += 
nxtrow[x] += 
currow[x + 1] += 
break; 

case 3: 
nxtrow[x + 1] += 
nxtrow[x - 1] += 
nxtrow[x] += 
currow[x + 1] += 
break; 


} 


// post process for last row pixels 
for (x = 0; x < width; x++) 
{ 


error/16; 
3*error/16 
5*error/16; 
T*error/16 


T7*error/16; 
error/16; 
3*error/16 

5*error/16; 


5*error/16 

T*error/16; 
error/16; 
3*error/16; 


3*error/16 
5*error/16; 
T7*error/16; 
error/16; 


int gray = nxtrow[x] > 1.0£? 0: 255; 


posArea[ (height-1) 
} 


return posArea; 


* width + x] = (255 << 24) 


(gray << 16) 


其 中 getGrayPixels 方 法 是 获取 对 应 像素 点 的 灰 度 值 ， 代 码 如 下 : 


(gray «« 8) | gray; 


private int getGrayPixels (int[] pixels, 


{ 
int gray = 
return gray; 


(pixels [index] >> 16) 


int index) 


& Oxff; 


14.3 ”笔画 参数 


通过 上 面 两 步 ， 我 们 很 顺利 地 找到 了 画笔 区 域 与 位 置 ， 现 在 需要 计算 笔画 参数 (Stroke Parameters) ， 即 需要 知道 笔画 宽度 与 高 度 、 角 度 、 中 心 位 置 等 信息 ， 这 样 才能 生成 每 个 笔画 。 这 些 参数 是 对 
采样 之 后 的 图 像 中 非 白 色 背 景 像 素 所 在 窗口 区 域内 所 有 像素 Moments 的 零 阶 、 一 阶 与 二 阶 值 计 算 后 得 到 的 。 这 些 内 容 对 读者 来 说 并 不 陌生 ， 本 书 第 10 章 详细 介绍 过 如 何 通过 Moment 值 计算 得 到 图 像 质心 
和 方向 ， 这 里 正好 用 上 。 计 算 采 样 点 中 心 位 置 坐标 点 的 公式 如 下 : 


| 


]Ü 


角度 (0) . BE (w) 与 高 度 (D) 计算 公式 如 下 : 


an [ 9 


U cp 


B x rm i = 


2 


其 中 a、b、c 的 值 由 如 下 公式 得 到 |: 


|| 


Ü1 


a= -x b= E — 
E oa e = 
io [i A Fa \ ra r 7 
igs M C. 4d M | 
| i ig! a — 1 
pü Jo 
: 完整 的 计算 笔画 参数 ， 生 成 笔画 对 象 的 代码 如 下 : 
// declare variables 
double m00, mO1, m10, mil, m02, m20; 
double a, b, c; 
double tempval; 
double dw, dxc, dyc; 
// calculate moments 
int[] wh = new int[2]; // width, height 
int[] roiArea = MomentsUtil.getRoi (scaledInput, x, y, s, s, sw, sh, wh) ; 
int[] xyrgb = getColorPixels (scaledInput, (y * sw + x) ) ; 
double[] mms = new double[60]; 
MomentsUtil.calculateMoments (roiArea, xyrgb, mms, wh[0], wh[1]) ; 
m00 = mms[0]; 
mol = mms[1]; 
m10 = mms[2]; 
mll = mms[3]; 
m02 = mms[4]; 
m20 = mms[5]; 


// calculate parameters 


dxc = m10 / m00; 

dyc = m01 / m00; 

a = (m20 / m00) - (double) ( (dxc) * (dxc) ) ; 

= 2 * (mll / m00 - (double) ( (dxc) * (dyc) ) ) ; 
= (m02 / m00) - (double) ( (dyc) * (dyc) ) ; 


ei theta = Math.atan2 (b, (a-c) ) / 2; 
tempval = Math.sqrt (b*b + (a-c) * (a-c) ) ; 


dw = Math.sqrt (6 * (atc - tempval) ) ; 
float w= (float) (Math.sqrt (6 * (atc - tempval) ) ) ; 
float 1 = (float) (Math. sqrt (6 * (atc + tempval) io ge 


int xc = (int) (x + Math.floor (dxc - 5/2) ) ; 

int yc = (int) (y + Math.floor (dyc - s/2) ) ; 

// factor*xc, factor*yc, factor*w, factor*l, (float) theta, rgb, level 

StrokeElement element = new StrokeElement (factor*xc, factor*yc, factor*w, factor*l, level, (float) theta, xyrgb) ; 
return element; 


其 中 根据 采样 点 与 输入 的 窗口 大 小 参数 ， 获 得 采样 点 周围 ROI 区 域 的 代码 如 下 : 


public static int[] getRoi (int[] scaledInput, int xc, int yc, int width, int height, int sw, int sh, int[] wh) { 
int x0 = xc - width/2; 
int yO = yc - height/2; 
/* adjust region to fit in source image */ 
if (x0«0) { 
width += x0; 
x0 = 0; 


if (x0 > width) x0 = width; 
if (y0< 0) | 

height += y0; 

y0 = 0; 


if (y0 > height) y0 = height; 
if ( (x0 + width) > sw) { 
width = sw - x0; 


if ( (y0 + height) > sh) { 
height = sh - y0; 


wh[0] = width; 
wh[1] = height; 
int[] roi = new int[width * height]; 
int rr = 0; 
int cc = 0; 
for (int row-y0; row< (y0 + height) ; row++) 
{ 
CG: =. 03 
for (int col= x0; col < (x0+width) ; col++) 


{ 
int index = row * sw + col; 
roi[rr*width + cc] = scaledInput [index]; 
cct; 


} 


TI: 


} 


return roi; 


计算 得 到 Moments 的 零 阶 、 一 阶 与 二 阶 等 六 个 初始 值 的 代码 如 下 : 


int y, xj 

int[] outPixels = colorDiff (roiArea, xyrgb, width, height) ; 
Arrays. fill (mms, 0) ; 

int index = 0; 


/ / *m00 = *m01 = *m10 = *m11 = *m02 = *m20 = 0; 
for (y = 0; y «height; yt^) { 
for (x = 0; x «width; x^^) | 
index = y*width + x; 
mms[0] += outPixels [index] ; // m00 
mms [1] += y * (outPixels[index]) ; // m01; 
mms[2] += x * (outPixels[index]) ; // m10; 
mns[3] += y * x * (outPixels[index]) ; // mll; 
mms[4] t= y * y * (outPixels[index]) ; // m02; 
mms[5] += x * x* (outPixels[index]) ; // m20; 


在 处 理 ROI 得 到 Moments 从 零 到 二 各 阶 值 之 前 ， 同 样 需要 通过 计算 颜色 之 间距 离 ， 该 处 理 与 StrokeAreafFilter 中 的 类 似 。 这 里 不 再 袭 述 。 对 所 有 采样 点 完成 上 述 计算 就 生成 了 对 应 采样 图 像 所 有 的 笔画 
信息 ， 对 原始 图 像 在 高 与 宽 上 缩小 z (其 中 n 为 循环 次 数 ) ， 分 别 实 现 笔画 区 域 处 理 、 采 样 与 笔画 的 生成 ， 这 样 做 的 目的 是 希望 更 多 采样 ， 使 手绘 油画 图 像 看 上 去 更 加 真实 。 该 过 程 的 代码 实现 如 下 : 


int count = 0; 
int factor = 1; 
int level = 1; 
int size = m es (width, height) ; 
if (s = { 
s= 4 


List«StrokeElement» allStrokes = new ArrayList<StrokeElement> () ; 

StrokeGenerator sg - new StrokeGenerator () ; 

while (size >4*s) { 
System.out.println ("Processing level : " + factor) ; 
allStrokes.addAll (sg.getStrokes (inPixels, strokeArea, s, factor, 

level, width, height) ) ; 


size /= 2; 
factor *= 2; 
level++; 


其 中 s 是 输入 参数 ， 决 定 笔画 数 采样 的 大 小 与 多 少 ， 通 常 来 说，s 值 越 小 ， 生 成 的 笔画 数 越 多 ， 得 到 油画 图 像 与 输入 图 像 越 相似 。 其 中 ，strokeElement 表 示 笔 画 信息 的 数据 结构 类 。 


144 ”笔画 绘制 


通过 上 面 三 小 节 的 学 习 ， 我 们 可 以 顺利 得 到 所 有 笔画 ， 现 在 要 解决 的 问题 就 是 如 何 将 这 些 笔画 绘制 到 一 张 空白 的 画布 上 ， 从 而 实现 一 幅 真正 的 手绘 油画 。 人 在 根据 笔画 信息 开始 绘制 之 前 ， 要 解决 三 个 问 


1) 绘制 顺序 问题 ， 笔 画 越 大 应 该 越 先 绘制 ， 这 符合 绘画 的 一 般 认 知 。 
2) 笔画 模板 问题 ， 这 里 通过 外 部 加 载 一 个 笔画 图 片 解决 。 读 者 还 可 以 自己 创建 笔画 图 片 。 
3) 由 于 加 载 的 笔画 大 小 是 固定 的 ， 所 以 要 根据 生成 的 笔画 信息 进行 适当 放 缩 与 旋转 之 后 才能 得 到 想 要 绘制 的 笔画 。 


这 样 三 个 问题 都 有 了 答案 ， 现 在 就 可 以 开始 绘制 了 。 绘 制 是 基于 透明 度 通道 的 画布 像素 与 笔画 信息 中 提供 的 像素 进行 对 应 位 置 的 像素 混合 ， 关 于 像素 混合 在 本 书 的 第 5 章 中 有 详细 介绍 ， 不 清楚 的 读者 可 


以 自己 回顾 一 下 。 对 所 有 笔画 循环 处 理 绘制 以 后 ， 一 幅 手 绘 油画 效果 的 图 像 就 会 生成 。 


实现 笔画 大 小 排序 的 代码 如 下 : 


private void sortByDesc (List«StrokeElement» allStrokes) { 
int size - allStrokes.size () ; 

// selection sort 
for (int i20; i<size-1; i++) 


{ 


float d = allStrokes.get (i) .getD () ; 
StrokeElement se = allStrokes.get (i) ; 
int selectedIndex = i; 

for (int j=i; j«size; j++) 


i J 


float dd = allStrokes.get (j) .getD () ; 


if (d <= dd) 
{ 
// swap 
selectedIndex = j; 
d = dd; 
} 
/ swap it 
f (selectedIndex == i) continue; 


trokeElement sej = allStrokes.get (selectedIndex) ; 
llStrokes.set (selectedIndex, se) ; 
lStrokes.set (i, sej) ; 
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* 根据 笔画 帘 、 高 与 角度 实现 笔画 放 缩 与 旋转 的 代码 如 下 : 


public BufferedImage getScaledImage (BufferedImage image, int w, int 1) { 
BufferedImage scaledImage = new BufferedImage (w, 1, 
BufferedImage.TYPE INT ARGB) ; 
Graphics2D graphics2D = scaledImage.createGraphics () ; 
graphics2D.setRenderingHint (RenderingHints.KEY INTERPOLATION, 
RenderingHints.VALUE INTERPOLAT ON BIL NEAR) ; 
graphics2D.drawImage (image, 0, 0, w, 1, null) ; 
graphics2D.dispose () ; 
return scaledimage; 


public BufferedImage rotateImage (BufferedImage image, double angle) { 
double sin = Math.abs (Math.sin (angle) ) , cos = Math.abs (Math.cos (angle) ) ; 
int w = image.getWidth () , h = image.getHeight () ; 
int neww = (int) Math.floor (w * cos + h * sin) , newh = (int) Math 

.floor (h * cos + w * sin) ; 

GraphicsConfiguration gc = owner.getGraphicsConfiguration () ; 

BufferedImage result = gc.createCompatibleImage (neww, newh, 

Transparency.TRANSLUCENT) ; 

Graphics2D g = result.createGraphics () ; 

g.translate ( (neww - w) / 2, (newh - h) / 2) ; 

g.rotate (angle, w / 2, h/ 2) ; 

g.drawRenderediImage (image, null) ; 

g.dispose () ; 

return result; 


- 像素 混合 imageBlend 方 法 的 代码 如 下 : 


long la, li; /* line jumps for both images */ 
int xi, yi; /* lower left corner in input image */ 


int xa, ya; /* corresponding corner in alpha image */ 
int wa, ha; /* area in alpha image to be blended */ 
int Xx, V3 

int r = rgb[0], g = rgb[1], b = rgb[2]; 


wa — stroke.getWidth () ; 
xa = 0; 

xi = xc - wa / 2; 

if (xi <0) | 


wa += xi; 
xa -= xi; 
xi = 0; 


rA: 


if (xi » width) 
return 0; 
if (wa <= 0) 
return 0; 
if (xi + wa >= width) 
wa = width - xi; 
ha = stroke.getHeight () ; 


ya = 0; 

yi = yc - ha / 2; 

if (yi <0) { 
ha += yi; 
ya -= yi; 
yi = 0; 

} 

if (yi > height) 
return 0; 

if (ha <= 0) 
return 0; 


if (yi + ha >= height) 
ha = height - yi; 


int[] sp = new int[stroke.getWidth () * stroke.getHeight () ]; 
getRGB (stroke, 0, 0, stroke.getWidth () , stroke.getHeight () , sp) ; 
getRGB (stroke, 0, 0, stroke.getWidth () , stroke.getHeight () , sp) ; 


int index = 0; 
Us. y< har yt+) d 
for (x20; x< wa; xt) { 
index = y * stroke.getWidth () + x; 
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int index2 = (y + yi) * width + (xi + x) ; 

int[] argb = getColorPixels (sp, index) ; 

int[] argb2 = getColorPixels (out, index2) ; 

float ba = argb[0] / 255.0f; 

Float bai = 1.0f - ba; 

int ta = (int) (ba * argb[0] + bai * argb2[0]) ; 

int tr = (int) (ba * r * bai * argb2[1]) ; 

int tg = (int) (ba * g + bai * argb2[2]) ; 

int tb = (int) (ba * b * bai * argb2[3]) ; 

setColorPixels (out, index2, new int[] { ta, tr, tg, tb }) ; 


} 
} 


return 1; 


上 述 各 个 步骤 合并 起 来 ， 实 现 的 代码 如 下 : 


// sort stroke, from lager size to small size 

sortByDesc (allStrokes) ; 

// load stroke template 

java.net.URL imageURL = this.getClass () .getResource ("stroke.png") ; 
BufferedImage strokeTemplate = null; 

try { 


strokeTemplate = ImageIO.read (imageURL) ; 
) catch (IOException e) { 


System.err.println ("An error occured when loading the image iconhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/OEBPS/Text/.. 
} 
// start to paint the stroke now! ! ! 
BufferedImage canvasImage = new BufferedImage (width, height, 
BufferedImage.TYPE INT ' ARGB) ; 
int[] resultPixels = new int[width * height]; 
// 和 白色 背景 画布 
Arrays. fill (resultPixels, -1) ; 
int totalStroke = 0; 
for (StrokeElement element : allStrokes) { 


int sw = (int) element.getW () ; 
int sh = (int) element.getL () ; 
if (sw == || sh == 0) continue; 
// 放 缩 
BufferedImage scaledImage = getScaledImage (strokeTemplate, sh, sw) ; 
a 旋转 
BufferedImage rotatedImage = rotateImage (scaledImage, element.getTheta () ) ; 


// 绘制 -像素 混合 
imageBlend (resultPixels, width, height, rotatedImage, element.getRgb () , element.getXc () , element.getYc () ) ; 
totalStroket+; 


we: 


完整 油画 绘制 可 以 参考 源 文 件 中 第 14 章 的 StrokePaintlyMain.java。 


14.5 程序 实现 


基于 本 章 前 四 节 所 讲 内 容 ， 完 整 实现 从 输入 图 像 到 输出 油画 图 像 的 代码 实现 中 ， 各 类 及 相互 关系 说 明 如 下 : 
: MainUI 类 ， 实 现 用 户 界 面 接口 ， 提 供 了 选择 图 像 与 运行 图 像 转 油画 显示 功能 。 

.MomentsUtl 类 ， 提 供 了 计算 图 像 Moments 各 阶 功能 的 工具 类 。 

.ScaleFilter 类 ， 实 现 了 图 像 放 缩 功能 的 滤 镜 类 ， 在 生成 笔画 信息 时 使 用 。 

:SttokeAteaFiltef 类 ， 实 现 图 像 笔 画 区 域 提 取 功 能 。 

.SttokeElement 类 ， 笔 画 绘 制 时 所 需要 信息 数据 结构 类 ， 用 来 存储 笔画 信息 。 

.StrokeGeneratof 类 ， 笔 画 生成 类 ， 实 现 了 对 笔画 各 种 参数 的 计算 。 

* StrokePaintlyMain 类 ， 使 用 上 述 各 个 类 ， 根 据 输 入 图 像 ， 实 现 油画 图 像 生成 。 


前 四 节 已 经 介绍 了 上 面 非 Ul 类 的 基本 功能 与 代码 实现 ， 本 节 主 要 围绕 Ul 类 串联 起 整个 程序 功能 实现 。 回 顾 本 书 前 3 章 的 知识 ， 通 过 对 Swing 按钮 组 件 添加 事件 监听 ， 实 现 用 户 事 件 响 应 ， 在 相应 的 响应 方 
法 中 添加 调用 StrokePaintlyMain 类 代码 即 可 实现 图 像 转 油 画 功 能 ， 当 然 前 提 是 我 们 已 经 选择 了 一 张 图 像 。 然 后 通过 重 载 JComponent 的 paintComponent 方 法 实现 界面 刷新 ， 从 而 显示 输出 油画 。MainUl 
类 正 是 用 来 实现 上 述 功能 的 ， 其 全 部 实现 代码 如 下 : 


package com.book.chapter.fourteen; 
import java.awt.BorderLayout; 
import java.awt.Dimension; 
import java.awt.FlowLayout; 
import java.awt.Graphics; 
import java.awt.Toolkit; 
import java.awt.Window; 
import java.awt.event.ActionEvent; 
import java.awt.event.ActionListener; 
import java.awt.image.BufferedImage; 
import java.io.File; 
import java.io.IOException; 
import javax.imageio.ImageIO; 
import javax.swing.JButton; 
import javax.swing.JComponent; 
import javax.swing.JFileChooser; 
import javax.swing.JFrame; 
import javax.swing.JPanel; 
public class MainUI extends JFrame implements ActionListener { 
/** 
* 
*/ 


private static final long serialVersionUID = 3570033620825245822L; 
public static final String PAINT CMD - "Paint"; 
public static final String SELECT CMD - "Select Imagehttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/OEBPS/Text/..." 


£ 


private JButton paintBtn; 
private JButton selectBtn; 
private BufferedImage srcImage; 


private BufferedImage destImage; 
private JComponent imagePanel ; 
public MainUI () 

{ 


super ("Automatic Paintly Render - GloomyFish") ; 
initComponent () ; 

} 

private void initComponent () { 
imagePanel = new JComponent () 


i 
/** 
* 
*/ 
private static final long serialVersionUID = 1L; 
@Override 
protected void paintComponent (Graphics g) { 
g.clearRect (0, 0, getWidth () , getHeight () ) ; 
: 
{ 


f (srcImage ! = null) 


g.drawImage (srcImage, 0, 0, srcImage.getWidth () , srcImage.getHeight () , null) ; 
} 
if (destImage ! = null && srcImage ! = null) 
{ 


} 
if (srcImage == null && destImage == null) 


{ 
} 


g.drawImage (destImage, srcImage.getWidth () + 10, 0, destImage.getWidth () , destImage.getHeight () , null) ; 


g.drawString ("Please select your imagehttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/OEBPS/Text/...", 1 


this.getContentPane () .setLayout (new BorderLayout () ) ; 
this.getContentPane () .add (imagePanel, BorderLayout.CENTER) ; 
paintBtn - new JButton (PAINT CMD) 
selectBtn - new JButton (SELECT CMD 
JPanel btnPanel = new JPanel () ; 
btnPanel.setLayout (new FlowLayout (FlowLayout.RIGHT) ) ; 
btnPanel.add (selectBtn) ; 
btnPanel.add (paintBtn) ; 
this.getContentPane () .add (btnPanel, BorderLayout.SOUTH) ; 
selectBtn.addActionListener (this) ; 


we 
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paintBtn.addActionListener (this) ; 


} 


public void openView () 


this.setDefaultCloseOperation (JFrame.DISPOSE ON CLOSE) ; 
java.net.URL imageURL = this.getClass () .getResource ("rainbow-fish-md.png") ; 


setIconImage (ImageIO.read (imageURL) ) ; 


) catch (IOException e) { 
System.err.println ("An error occured when loading the image iconhttp://www.hzcourse.com/resource/readBook?path-/openresources/teach ebook/uncompressed/15509/0EB 


} 

this.setPreferredSize (new Dimension (800, 660) ) ; 
pack () ; 

centreView (this) ; 

setVisible (true) ; 


} 
public static void centreView (Window w) { 
Dimension me = w.getSize () ; 
Dimension screenSize = Toolkit.getDefaultToolkit () .getScreenSize () ; 
int newX = (screenSize.width - me.width) /2; 
int newY = (screenSize.height - me.height) /2; 
w.setLocation (newX, newY) ; 


} 


public static void main (String[] args) 


MainUI ui = new MainUI () ; 

ui.openView () ; 
} 
@Override 
public void actionPerformed (ActionEvent e) { 
String command = e.getActionCommand () ; 
System.out.println ("Command : " + command) ; 
if (command.equals (SELECT CMD) ) 
{ 


JFileChooser chooser = new JFileChooser () ; 
chooser.showOpenDialog (null) ; 


File £ = chooser.getSelectedFile () ; 
if (f — null) return; 
try { 
srcImage = ImagelO.read (f) ; 
) catch (IOException el) { 


el.printStackTrace () ; 


} 
this.repaint () ; 


else if (command.equals (PAINT CMD) ) 


// stroke area 

StrokePaintlyMain spm = new StrokePaintlyMain (this) ; 
destImage = spm.filter (srcImage, null) ; 
this.repaint () ; 


关于 Java Swing 的 更 多 讨论 已 经 超出 本 书 范 畴 ， 感 兴趣 的 读者 可 以 阅读 JDK 官 方 文 档 中 的 Swing 教程 进行 学 习 。 本 章 所 有 Java 类 的 源 代码 可 以 参考 本 书 源 文件 中 的 第 14 章 。 


至 此 ， 基 于 Moments 完 整 的 图 像 转 油画 算法 原理 与 实现 就 介绍 完了 。 本 例 学 习 完 后 ， 希 望 读者 能 够 建立 起 图 像 处 理 不 是 简单 的 知识 点 运用 ， 而 是 一 系列 知识 点 的 综合 运用 的 概念 。 这 里 还 想 特别 强调 一 


下 ， 源 代码 是 本 书 的 一 部 分 ， 阅 读 、 运 行 与 调试 本 书 中 所 有 源 代 码 有 助 于 读者 更 好 理解 与 掌握 本 书 所 介绍 的 知识 。 
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过 介绍 一 篇 论文 上 有 趣 的 油画 算法 实现 ， 帮 助 读者 灵活 运用 本 书 所 学 的 各 种 图 像 知 识 ， 从 而 达到 对 本 书 所 学 知识 的 加 深 理解 、 活 学 活用 ， 同 时 也 希望 能 帮助 读者 掌握 更 多 的 图 像 处理 编 程 技巧 ， 
tA By 


E 
掌握 更 多 的 实践 知识 ， 积 累 图 像 处 理 编程 经 验 ， 提 升 对 学 习 图 像 处 理 的 兴趣 与 信心 。 当 然 本 章 实 现 的 程序 还 有 很 多 不 足 之 处 ， 首 先是 不 能 灵活 调整 输入 参数 ， 其 次 是 像素 混合 做 得 不 够 好 ， 和 希望 感 兴 趣 的 读 
者 能 够 进一步 改进 、 完 善 。 本 章 也 是 本 书 的 最 后 一 章 ， 但 是 作者 真诚 希望 本 书 能 够 成 为 各 位 学 习 图 像 处理 的 良好 开端 ， 而 不 是 结束 。 


附录 数学 知识 参考 引用 


1. 三 角 函 数 与 反 三 角 函 数 


三 角 遂 数 在 图 像 几 何 变换 中 的 像素 点 坐标 转换 ， 常 见 的 三 角 遂 数 正弦 、 人 余弦、 正切 、 余 切 公式 如 下 : 


0l 3 | 人 了 
sino = B. = ——. cosÓ0 zum. = - Land m hm . cot = - == 


C 5° C 5o h 4? 7 


ges NN C2 


t 


图 像 处 理 中 最 常见 的 反 三 角 函 数 是 正切 反 三 角 函 数 ， 公 式 为 =arctanx=tan-1x， 其 取 值 范围 为 2*2], 需要 注意 的 是 本 书 中 基于 java 语言 实 现 的 反正 切 三 角 国 数 有 两 个 AP1， 其 中 支持 两 个 参数 的 正切 


RZÆŘŽAPI-Math.atan (y, x) ， 其 取 值 范围 为 [-T，T]。 
2. 距 离 计算 公 式 


平面 坐标 两 点 A (x1, y1) 5B (x2, y2) 之 间 的 距离 公式 为 : 


f 


— Ay ) i 


| AB | = h (y = y1) “+ (x, 


三 维 坐 标 两 点 A (X1, y4, z1) 5B (x2, yo, z2) 之 间 的 距离 公式 为 : 


. 5 4 2 ana 
|AB | = qz ue) 4i(ys—931) xm (2) 
在 图 像 处 理 中 (1) 通常 用 于 计算 两 个 像素 点 之 间 的 空间 距离 ， (2) 通常 用 于 计算 两 个 像素 点 之 间 的 RGB 像素 差异 . 

3. 矩 阵 运 算 


a) 矩阵 加 减 要 求 两 个 矩阵 的 大 小 完全 相同 
2 4 | -2 
THE sl — -3 
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矩阵 A-B 结 果 为 : 


Nar datat T" 
EC 4-6-4) MAE. 


b) 和 矩阵 乘法 ， 假 设 矩 阵 A 大 小 为 nxn， 和 矩阵 B 大 小 为 nxP， 则 得 到 的 最 终 和 矩阵 C 大 小 为 mxp 


| 3 
E iF fe a a us 2 | " ^L. 
HEREA = 13 AlKA/A3x2, EB = : ! 4 大 小 为 2x3 
5 6 i : 


则 矩阵 C=AB 的 大 小 为 3<3， 结 果 为 : 


3x1t*2xl 182242 26-1) l1*lÓq2zx3 3 OF 7 
C=/3x344x1 3x244x(-1) 3x1+4x3/=/13 2 15 
5x30-6xl 5x2 rO6Ox(-1) 5xl +6x3 21 4 23 


4 .向量 特 征 值 


B 1 
BARERA- -1 - s, 计算 特征 值 过 程 如 下 : 


2 4 | 0 sg 1 
e1 e 0 1 =| =H- 


det(A - AJ) = (2 -A)(-6-A) +7 =A’ +4A -5 = (A *5)(A-1) =0 
即 特 征 值 M1 =-5， 和 2=1。 


5. 二 次 或 三 次 多 项 式 


i 


F 


ax bx +c 


: 7 
y = ax - bx +exta 


主要 用 于 像素 插值 计算 。 


6 .平面 坐标 与 极 坐 标 


假设 平面 坐标 点 P (x，y) ， 其 中 x=12，y=5， 则 它 的 极 坐标 对 应 点 P (r, 0) ， 其 中 r=/F -=13， 又 =tan6=y/x=5/12， 得 到 9= ” ( ETA 


7. 卷 积 (定义 与 公式 ) 
设 : f (x) 、g (x) 是 R1 上 的 两 个 可 积 立 数 ， 在 有 限 范围 [0， 慎 内 的 卷 积 为 : 


S (i) = F reli — T)dT 


当 取 值 范围 为 [-co，co] 时 : 
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8. 高 斯 公式 
| f(x) | (any) 2 
gH: Ex Hh pe ay. j Al 三 EE 
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9. 导 数 
导数 (Derivative) 是 微 积分 中 的 重要 基础 概念 。 当 函数 y=f (x) 的 自 变 量 x 在 一 点 X0 上 产生 一 个 增 量 Ax 时 ， 如 果 存 在 函数 输出 值 的 增 量 Ay 与 自 变 量 增 量 Ax 的 比值 在 Ax 趋 于 0 时 的 极限 a，a 即 为 在 x0 处 


df 
的 导数 ， 记 作 f (xo) 或 翌 (%)， 导 数 是 函数 的 局 部 性 质 。 一 个 函数 在 某 一 点 的 导数 描述 了 这 个 函数 在 这 一 点 附近 的 变化 率 ， 所 以 常常 在 图 像 处 理 中 用 来 计算 图 像 像素 值 的 梯度 变化 率 。 


假设 有 函数 为 : f (x) =3x3-6x2+2x-1 

对 应 的 一 阶 导数 为 : f(x) =i =9x2-12x42 

对 应 的 二 阶 导 数 为 : f (x) = =18x-12 

二 阶 导数 的 意义 在 于 告诉 我 们 一 阶 导数 变化 方向 是 增 大 还 是 减 小 。 


10. 统 计 学 (计算 数据 均值 、 方 差 、 标 准 偏 差 ) 


假设 有 采样 数据 a0， a1, a2, a3, ad, tp dn-1,; 则 


3B. = 一 -一 . JE = 


fl 


11. 相 关 数 学 知识 学 习 推荐 站 点 


http:/ /www.coolmath.com 


http:/ /mathworld.wolfram.com 


http:/ /www.mathsisfun.com 


